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1 Einleitung 


Der Einsatz von Maschinen erleichtert das Leben der Menschen, indem sie diese bei Aufgaben 
unterstützen oder ihnen die Erledigung vollständig abnehmen. Der technische Fortschritt er- 
laubt die Automatisierung von immer komplexeren Aufgaben, sodass Mensch und Automation 


zukünftig häufiger Arbeitsbereiche teilen und Aufgaben kooperativ erledigen. 


Die Kooperation zwischen Mensch und Maschine kann als ein Zustand, bestehend aus den 
Befugnissen, Fähigkeiten, Verantwortungsbereichen und Eingriffen der beiden Partner, be- 
schrieben werden [FHH*12]. Als besonders anspruchsvoll gelten in diesem Zusammenhang 
die Zeiträume, in denen der Zustand wechselt, die sogenannten Transitionen. Für einen erfolg- 
reichen Wechsel des Zustands müssen die Akteure ihr jeweiliges Modell über die Interaktion 
gleichermaßen anpassen. Geschieht dies nicht, sind zwei Fälle möglich. Im ersten Fall über- 
nimmt ein Partner Teile der Tätigkeit, die im Modell des anderen Partners noch diesem zuge- 
ordnet sind. Dies wird in der zitierten Veröffentlichung als Überschuss an Kontrolle bezeichnet 
und führt potenziell zu verminderter Akzeptanz für das System. Problematischer ist demge- 
genüber der zweite Fall zu sehen. In diesem übernimmt ein Partner nicht die Bereiche, die ein 
anderer abgibt, und somit entsteht ein sogenanntes Defizit an Kontrolle über die Tätigkeit. Je 


nach Aufgabe können sich hierdurch kritische Situationen entwickeln. 


Besonders anfällig für Fehler sind Transitionen nach Phasen, in denen die Automation die 
gemeinsame Aufgabe für längere Zeit alleine erledigt hat, da dies zum sogenannten Out-of- 
the-Loop Performance Problem führen kann [EK95a]. Durch die zeitweise Entkopplung und 
den potenziellen Fokus auf andere Tätigkeiten vermindert sich das zur Bewältigung der Aufga- 
be nötige Situationsbewusstsein des Menschen. Der Begriff Situationsbewusstsein wird dabei 
als die Wahrnehmung der Umgebung, das Erfassen ihrer Bedeutung und die Prognose des 
Umgebungszustands in naher Zukunft definiert [End88]. Beispiele aus der Luftfahrt zeigen 
die möglichen katastrophalen Folgen, wenn bei einer Transition der Flugzeugführung an den 
Piloten! die Ausgangslage aufgrund mangelnden Situationsbewusstseins falsch eingeschätzt 
und fehlerhaft gehandelt wird [ES97, YSH07]. 


Aktuelles Beispiel für die zunehmende Automatisierung ist das hochautomatisierte Fahren. 
Es wird bereits intensiv an Systemen, welche die Fahraufgabe vollständig übernehmen kön- 
nen, geforscht und deren Funktion in Versuchsfahrzeugen getestet (z.B. [Way18, WRW' 19]). 


1 Alle Angaben zu Personen gelten in dieser Arbeit unabhängig vom Geschlecht. Aus Gründen der Lesbarkeit wird 


in der gesamten Arbeit die männliche Form verwendet. 
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Während bei aktuellen Fahrzeugen der Fahrer die Fahrsituation die gesamte Zeit überwa- 
chen, bewerten und falls erforderlich auf die Ereignisse sofort reagieren muss, darf er sich 
bei zukünftigen Systemen mit höheren Automatisierungsgraden nun auch fahrfremden Tä- 
tigkeiten widmen. Systeme, bei denen die Fahrer erstmalig komplett von der Fahraufgabe 
entbunden sind, werden als Level-3-Systeme bzw. Conditional Driving Automation bezeich- 
net [SAE16]. Der Nutzer muss bei Anwendung eines solchen Systems jedoch in der Lage sein, 
eine sogenannte Übernahmeaufforderung aufzunehmen und als Rückfallebene für die Auto- 
mation die Fahraufgabe zeitnah übernehmen?. Die Grenzen dieser Systeme und damit Aus- 
löser für eine Übernahmeaufforderung können Fehlerdetektionen in Soft- und Hardware sein 
oder auch Straßen- und Wetterbedingungen, welche die Funktion des Systems einschränken 
[LCZ*18, KVV16]. Die Gestaltung dieser Transition der Fahraufgabe zurück an den Fahrer 
wird als eine der zentralen, ungelösten Herausforderungen auf dem Weg zum hochautomati- 
sierten Fahren betrachtet [ARB* 15]. 


Bei Systemen mit noch höherem Automatisierungsgrad (Level 4) übernimmt das System die 
Funktion der Rückfallebene selbst und kann in einem eingeschränkten Betriebsbereich, wie 
beispielsweise der Autobahn, alle Situationen selbst bewältigen. Dennoch kann es auch hier 
aus Komfort- oder Akzeptanzgründen sinnvoll sein, zunächst den Nutzer zur Übernahme auf- 
zufordern, bevor Manöver zur Herstellung eines risikominimalen Zustands durchgeführt wer- 
den. Weiterhin muss auch für diese Systeme spätestens bei Verlassen des Betriebsbereichs der 


Automation eine Übergabe der Fahrzeugführung an den Fahrer erfolgen. 


Eine Beschreibung des Ablaufs einer solchen Übergabe einer Aufgabe von einem Automati- 
sierungssystem an den Menschen stellen Karakaya et al. am Beispiel des hochautomatisierten 
Fahrens vor [KKB18]. Der Ablauf ist schematisch in Abbildung 1.1 dargestellt. Ausgangspunkt 
des Übergabeprozesses ist die Aufforderung an den Menschen, die Kontrolle der Fahrzeugfüh- 
rung zu übernehmen, nachdem das bevorstehende Erreichen einer Systemgrenze erkannt wur- 
de. Bis zu diesem Zeitpunkt war es ihm gestattet, sich mit fahrfremden Tätigkeiten zu befassen, 
da die Automation die Fahraufgabe bis dahin selbstständig und zuverlässig erledigen konnte. 
Das Ziel des Prozesses muss sein, die Fahraufgabe in der Art an den Menschen zu übertragen, 
dass dieser spätestens ab dem Erreichen der Systemgrenze in der Lage ist, das Fahrzeug sicher 
zu führen. Die Autoren unterteilen den Übergabeprozess zwischen diesen beiden Zeitpunkten 
hierzu in zwei Phasen?. In der Präparationsphase löst sich der Fahrer von seiner Nebentätigkeit 
und bereitet sich auf die Übernahme vor. Er begibt sich in eine geeignete Position, um Lenk- 
rad und Pedale zu bedienen und beginnt damit, die aktuelle Fahrsituation wahrzunehmen. Da 
er noch nicht die Fahrzeugbewegung beeinflussen kann, muss die Automation in dieser Pha- 


se noch die sichere Kontrolle gewährleisten. Sobald die Hände des Fahrers am Lenkrad sind, 


? Die exakte Formulierung der Anforderung lautet: „[The driver] is receptive to a request to intervene and responds 


by performing DDT [dynamic driving task] fallback in a timely manner“. 

Die Autoren von [KKB18] verwenden in ihrer Arbeit die Begriffe Transitionsphase 1 und 2. Hier wird stattdessen 
die Terminologie Präparationsphase und Transitionsphase genutzt, welche eine bessere Unterscheidbarkeit bietet 
und den Fokus dieser Arbeit auf die haptische Transition der Aufgabe verdeutlicht. 
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beginnt die Transitionsphase. Jetzt ist der Fahrer physisch dazu in der Lage, das Fahrzeug zu 
steuern, jedoch fehlt ihm, wie bereits erlautert, mit hoher Wahrscheinlichkeit das notige Situa- 
tionsbewusstsein, um die Fahraufgabe korrekt und sicher durchzuführen. Stattdessen baut er 
die Fähigkeit erst auf, wobei der genaue Verlauf bis zu dem Punkt an dem der Fahrer die Auf- 
gabe alleine sicher bewältigen kann offen bleibt. Wird die Automation bereits mit Erreichen 
der physischen Bereitschaft am Ende der Präparationsphase deaktiviert, entsteht ein Defizit 
an Kontrolle. Dieses Defizit muss vermieden werden, um eine sichere Transition zu gewähr- 


leisten. 


Bewältigung i 
der Fahraufgabe l 


Automation Mensch 


100 % 


0% 


+— Praparationsphase ——»>'«————— Transitionsphase —————>! 


Abbildung 1.1: Schematischer Aufbau des Ubergabeprozesses angelehnt an [KKB18]. Nach der Ubernahme der Be- 
dienelemente ist der Fahrer nicht sofort in der Lage, die Fahraufgabe sicher zu bewältigen, sondern 
baut diese Fähigkeit erst mit einem unbekannten Verlauf auf. Wird die Automation in dieser Phase 
sofort deaktiviert (dunkelblauer Bereich), entsteht ein Defizit in der Bewältigung der Fahraufgabe 
(hellblauer Bereich). 


Aus dieser Problematik ergibt sich die zentrale Fragestellung der vorliegenden Dissertations- 
schrift: 


Wie muss eine Automation gestaltet werden, die den Menschen bei der Übernahme der Aufgabe 


in der Transitionsphase unterstützt? 


Zur Beantwortung dieser Frage werden zunächst in Kapitel 2 die bisherigen wissenschaftli- 
chen Erkenntnisse zur Übergabe der Fahraufgabe von der Automation an den Menschen, sowie 
Methoden aus dem Stand der Wissenschaft zur Modellierung von Interaktion und der dyna- 
mischen Verteilung von Rollen dargestellt. Die sich daraus ergebende Forschungslücke führt 
am Ende des Kapitels zu den konkreten Forschungsfragen dieser Arbeit. In Kapitel 3 erfolgt 
die Vorstellung des spieltheoretischen Konzepts der Differentialspiele, deren Lösung, sowie 
der Erweiterung der Modellierung, um mit diesem Ansatz eine Interaktion zweier Partner mit 


dynamischen Rollen abbilden zu können. Ein neu entwickeltes Verfahren für die Adaption des 
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Ubergabeverlaufs an die menschliche Aktion ist Gegenstand von Kapitel 4. Zur Validierung 
der neuen Methoden und für deren Vergleich mit konventionellen Ansätzen wurden drei Ex- 
perimente durchgeführt. Hierfür wurden die entwickelten Ansätze im Kontext des eingangs 
motivierten Anwendungsfalls von Übernahmeaufforderungen an Systemgrenzen einer hoch- 
automatisierten Fahrfunktion umgesetzt. Der Ablauf und die Resultate dieser Experimente 
werden in Kapitel 5 präsentiert und deren Ergebnisse diskutiert. Die Arbeit schließt in Kapitel 


6 mit einer Zusammenfassung der wichtigsten Erkenntnisse. 


2 Stand der Wissenschaft 


In diesem Kapitel werden bisherige wissenschaftliche Aussagen zu Transitionen von Aufga- 
ben zwischen Mensch und Maschine zusammengefasst. Der Schwerpunkt liegt hierbei auf der 
Transition der Fahraufgabe. In Abschnitt 2.1 werden zunächst die Transitionsarten klassifiziert 
und Experimente präsentiert, welche die Nachteile von direkten Übergaben ohne Unterstüt- 
zung aufzeigen. Anschließend wird in Abschnitt 2.2 das Prinzip des Haptic Shared Control 
eingeführt und dessen praktische Anwendungen auf dynamische Anpassung der Rollen in 
der Mensch-Maschine-Interaktion dargestellt. Erste Umsetzungen derartiger Systeme für die 
Übergabe nach einer hochautomatisierten Fahrt und deren Mängel sind Gegenstand von Ab- 
schnitt 2.3. In Abschnitt 2.4 werden spieltheoretische Konzepte zur Modellierung und Adap- 
tion der Kooperation von Mensch und Maschine gezeigt, welche das Potenzial besitzen, die 
Beeinträchtigungen der zuvor genannten Verfahren zu beheben. Am Ende des Kapitels wird 
in Abschnitt 2.5 die bestehende Forschungslücke zusammenfassend formuliert und die Leit- 
frage aus der Einleitung in die konkreten Forschungsfragen zerlegt, welche in dieser Arbeit 


beantwortet werden sollen. 


2.1 Transition der Fahraufgabe im hochautomatisierten 
Fahren 


Transitionen im hochautomatisierten Fahren können nach dem Initiator der Transition und 
dem Partner, der nach der Übergabe die Kontrolle innehat, unterteilt werden [LW15]. Somit 
ergeben sich vier Kategorien aus der Kombination von Fahrer bzw. Automation als Auslöser 
mit jeweils Fahrer und Automation als Verantwortlicher nach Abschluss der Übergabe. Die 
Klassifizierung kann um eine Dimension erweitert werden, die beschreibt, ob die Übergabe 
zwingend notwendig oder optional ist [LHC* 16]. Besondere wissenschaftliche Aufmerksam- 
keit erhält hierbei die notwendige, von der Automation herbeigeführte Transition an den Men- 
schen, da die benötigte Zeitdauer bis zur vollständigen Wiederherstellung der Fahrfähigkeit 
unklar ist und aus dem potenziellen Defizit an Kontrolle das Risiko des Auftretens von kriti- 


schen Situationen besteht. 


Aufgrund der hohen Relevanz existieren bereits viele wissenschaftlichen Veröffentlichungen 


zur Übergabe der Fahrzeugführung an den Menschen aus einer hochautomatisierten Fahrt. Ei- 
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ne ausfithrliche Ubersicht tiber 22 Studien zu diesem Thema gibt [VVK* 16]. Der Schwerpunkt 
dieser Studien liegt jedoch größtenteils auf der Präparationsphase. Ermittelt werden demnach 
Zeiten, die fiir eine erfolgreiche Ubernahme notwendig sind, sowie Einflussfaktoren auf diese 
Zeiten, wie die Komplexitat der Situation [DFTB12, GDLB13], die Art der Nebentatigkeit des 
Fahrers [PHMM13, RGL*14] oder die Modalität und Gestaltung der Ubernahmeaufforderung 
[NMN14a, PHM*15]. Die Mehrheit dieser Arbeiten definieren die Ubergabezeit als die Zeit 
zwischen Übernahmeaufforderung und motorischer Handlungsbereitschaft [NMN14a] oder 
erster Reaktion an den Stellteilen [PHMM13, RGL*14], d.h. die Zeitdauer, die benötigt wird, 
bis der Fahrer die Kontrolle über Lenkrad und Pedale übernimmt (Ende der Präparationspha- 
se) bzw. eine erste Lenk- oder Bremsaktion durchführt (erster Teil der Transitionsphase). Die 
automatisierte Fahrfunktion wird zeitgleich mit der Übernahmeaufforderung innerhalb von 
1s ausgerampt [PHMM13] oder direkt abgeschaltet, sobald eine erste Fahraktion des Fahrers 
erfolgt ist [GDLB13]. Teilweise werden keine näheren Angaben zum Deaktivierungsprozess 
gegeben [NMN14a, RGL* 14]. Die nachfolgend aufgeführten Veröffentlichungen zeigen jedoch, 
dass die Fähigkeit des Fahrers, nach einer Übernahmeaufforderung das Fahrzeug sicher zu 


steuern, noch stark beeinträchtigt sein kann. 


Beispielsweise zeigen Merat et al. [MJL* 14], dass die Qualität der Spurhaltung, gemessen an 
der Standardabweichung der Spurposition, der Anzahl der Lenkumkehrungen und der Fre- 
quenz der Lenkkorrektureingriffe, noch bis zu 40s nach der Übernahmeaufforderung ver- 
schlechtert sein kann. Brandenburg und Skottke [BS14] berichten analog dazu verringerte 
Sicherheitsabstände für die Längsführung in einem Zeitraum von 5-6 min nach der Übernah- 


me aus einer hochautomatisierten Fahrt. 


Die Autoren von [DFTB12] betrachten in ihrem Experiment zeitkritische Übergaben in kom- 
plexen Situationen. Sie zeigen, dass es in diesen Fällen vermehrt zu Fahrfehlern kommt. In 
ihrem Versuch verglichen sie die Fahrleistung in drei unterschiedlich anspruchsvollen Sze- 
narien (Spurhalten, Spurwechsel, Spurauswahl) für eine manuelle Fahrt und drei Varianten 
eines Automatisierungssystems, welches die Systemgrenze 4s, 6s oder 8s vor Erreichen er- 
kennt und den Fahrer zu diesem Zeitpunkt zur Übernahme der Fahrzeugführung auffordert. 
Während der automatisierten Fahrt beschäftigten sich die Probanden mit einer Nebenaufgabe 
auf einem Display. Im einfachsten Szenario konnten alle Probanden die Situation beherrschen, 
jedoch zeigte sich bei den komplexeren Situationen ein signifikanter Anstieg der Fahrfehler 
bei Vorwarnzeiten von 4s und 6 s im Vergleich zur manuellen Fahrt. Selbst bei einer Vorwarn- 
zeit von 8 s führten einige Probanden den notwendigen Spurwechsel gar nicht, zu spät oder in 


die falsche Richtung aus. 


Das Gefahrenpotenzial im Anschluss an eine Übernahmesituation zeigt sich auch in [GDLB13]. 
Die Autoren verglichen die Reaktionen von durchgehend manuell fahrenden Probanden mit 
denen von Probanden, die die Fahraufgabe erst kurz zuvor von der Automation übernommen 


hatten. Dafür betrachteten sie zwei Variationen eines Szenarios, in dem ein vorausfahrendes 
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Fahrzeug den Blick auf ein stehendes Hindernis 5 s bzw. 7s vor einer potenziellen Kollision 
freigab. Zu diesem Zeitpunkt wurden die bis dahin automatisiert fahrenden und mit Hilfe ei- 
ner Nebenaufgabe abgelenkten Probanden zur Übernahme der Fahrzeugführung aufgefordert. 
Zwar gelang es allen Versuchspersonen, das Hindernis zu umfahren, jedoch reagierten die zu- 
nächst automatisiert fahrenden Probanden später und mit einem signifikant dynamischeren 
Ausweichmanöver. Die mittleren Beschleunigungen des Fahrzeugs entsprachen dem zwei- bis 
dreifachen der Werte der Gruppe der Probanden, die durchgehend manuell gefahren waren. 
Zudem sicherten 18 der 26 zunächst automatisiert fahrenden Probanden ihren Spurwechsel 
nicht mit einem Schulterblick ab, wodurch ein hohes potenzielles Kollisionsrisiko mit benach- 


barten Verkehrsteilnehmern deutlich wurde. 


Russell et al. [RHN* 16] analysieren in ihrer Studie die Hypothese, dass ein Fahrer zum Zeit- 
punkt der Übernahme ein inkorrektes Modell von Fahrzeug und Situation besitzt und somit 
Zeit benötigt, um sich an die neue Ausgangslage anzupassen. Dazu führten sie einen Ver- 
such durch, in dem sie Probanden mit einem Experimentierfahrzeug mehrmals einen Parcours 
abfahren ließen. In jeder Runde mussten die Versuchspersonen nach einer Übernahmeauf- 
forderung einen Spurwechsel nach rechts oder links durchführen. Nach vier Durchgängen 
wurden Parameter des Fahrzeugs variiert und der Anpassungsprozess während der folgenden 
Durchgänge beobachtet. Ihre Ergebnisse zeigen, dass bei Modifikation der Lenkübersetzung 
Lenkoszillationen auftraten und es über vier Durchgänge dauerte, bis sich die Versuchsperso- 
nen an die neue Parametrierung angepasst hatten und das Lenkverhalten dem Stand vor der 
Modifikation entsprach. Die Autoren schlagen vor, diesen Anpassungsprozess bei der Gestal- 
tung der Transition von automatisiertem zu manuellem Fahren zu berücksichtigen. Das di- 
rekte Abschalten der Automation soll durch eine Phase der geteilten Fahrzeugführung ersetzt 
werden, um den Menschen an die neue Situation heranzuführen. Zu einer ähnlichen Schluss- 
folgerung kommen auch Kaustubh et al., die in [KWM16] ein hybrides Modell vorstellen, mit 
dem sich Übergaben der Fahrzeugführung zwischen Mensch und Automation simulieren las- 
sen. Da auch hier der direkte Wechsel vom Zustand „automatisiertes Fahren“ in den Zustand 
„manuelles Fahren“ Oszillationen im Lenkwinkel verursacht, empfehlen sie ebenfalls einen 


graduellen Abschaltvorgang. 


Die genannten Quellen zeigen dementsprechend, dass sich das Fahrverhalten nach der Über- 
nahme noch von dem einer durchgängig manuellen Fahrt unterscheidet. Insbesondere in kriti- 
schen Übergabesituationen können diese Beeinträchtigungen in der Erfüllung der Fahraufgabe 
das Kollisionsrisiko erhöhen. Es wird empfohlen, in den Übergabeprozess eine Phase zu inte- 
grieren, in der der Fahrer und die Automation die Fahraufgabe gemeinsam durchführen und 
der Fahrer durch diese graduelle Übergabe langsam an die Fahraufgabe herangeführt wird. Im 
nachfolgenden Abschnitt werden deshalb Konzepte vorgestellt, die eine gemeinsame Ausfüh- 
rung einer Aufgabe von Mensch und Maschine, mit der Möglichkeit die Rollen im Betrieb zu 


verändern, erlauben. 
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2.2 Dynamische Rollenanpassung mittels Haptic Shared 
Control 


Einen erfolgversprechenden Ansatz, den Menschen beim Aufbau des Situationsbewusstseins 
zu unterstützen, bietet das Konzept des Haptic Shared Control. Abbink und Mulder [AM10] 
definieren Haptic Shared Control als Methoden der Mensch-Maschine-Interaktion, die es so- 
wohl dem Menschen als auch der Automation erlauben, Kräfte auf ein Stellglied auszuüben, 
über welches das System gesteuert wird. Die Vorteile dieses Konzepts benennt [AMB12]: Die 
Nutzung desselben Stellgliedes ermöglicht den beiden Partnern Mensch und Maschine kon- 
tinuierlich miteinander zu interagieren und ihre Absichten über die applizierte Kraft direkt 
haptisch zu kommunizieren. So kann der menschliche Partner geführt werden, wodurch seine 
Leistung erhöht und seine Arbeitsbelastung vermindert wird. Trotzdem behält der menschli- 
che Partner die Kontrolle über das System und kann die Automation jederzeit überstimmen. 
Umsetzungen dieses Konzepts zeigen gute Ergebnisse in vielfältigen Anwendungsbereichen, 
wie der Luftfahrt [GWS08], der Robotik [BAHH11] und der Fahrerassistenz [GG05, FKL* 08]. 
Nachfolgend werden Haptic Shared Control Methoden vorgestellt, die es erlauben, die Rollen 
im Betrieb anzupassen und die Führung in Richtung des Menschen oder der Automation zu 


verschieben. 


Oguz et al. [OKSB10] stellen eine Methode vor, die es erlaubt, zwischen einer gleichberech- 
tigten Rollenverteilung und einer Verteilung, in welcher der Nutzer der dominante Akteur 
ist, hin- und herzuschalten. Die aktuelle Verteilung wird über die applizierte Kraft verhan- 
delt. Liegt die Eingabe des Menschen über einer vordefinierten Schwelle, wird die Kontrolle 
zu ihm verschoben. Liegt sie darunter, wird angenommen, dass er Hilfe benötigt und folglich 
mehr unterstützt. In [KSB13a] wird die Methode noch um zusätzliche visuelle und vibrotaktile 


Reize erweitert, um dem Nutzer über den aktuellen Zustand zu informieren. 


Passenberg et al. [PGPB11] führen Experimente mit verschiedenen Kooperationsgraden in un- 
terschiedlichen Testszenarien durch, um anschließend anhand der Kriterien Aufgabenerfül- 
lung und Arbeitsaufwand den statisch-optimalen Grad an Unterstützung für ein spezifisches 
Szenario zu berechnen. Als Erweiterung führen sie eine Online-Adaption durch, in der sie die 
aktuelle Kräfteverteilung zwischen Mensch und Maschine mit aufgezeichneten Verteilungen 
der Kräfte im entsprechenden Szenario vergleichen und die Unterstützung entsprechend wäh- 


len. 


In der als Blended Shared Control bezeichneten Variante von Enes und Book [EB10] wird ein 
Verteilungsfaktor eingeführt, mit dem der Stellaufwand kontinuierlich zwischen Mensch und 
Automation verschoben werden kann. Sie nehmen an, dass der Mensch die Aufgabe überneh- 
men möchte, falls der Abstand zum Zielzustand und/oder die Differenz zwischen seiner Stell- 


größe und der der Automation hoch ist, sodass in diesem Fall die Kontrolle über die Aufgabe 
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zum menschlichen Partner verschoben wird. Maske et al. [MCP16] erweiterten diesen Ansatz 
und nutzen die Rate, mit der die menschliche Stellgröße von der der Automation abweicht, als 
Indikator für die Absicht, die Aufgabe übernehmen zu wollen. Unter der Annahme einer kor- 
rekten Reaktion des Menschen in einer unvorhergesehenen Situation ermöglicht dieser Ansatz 


eine schnelle Abgabe der Kontrolle an den Menschen. 


Zusammengefasst zeigen die Quellen interessante Verfahren, mit denen sich der Designgrund- 
satz des Haptic Shared Control auf Anwendungen mit variablem Automatisierungsgrad über- 
tragen lässt. Die in diesem Abschnitt vorgestellten Ansätze gehen jedoch trotzdem von einer 
durchgängigen Kooperation von Mensch und Maschine aus. Der menschliche Partner ist somit 
nie vollständig von der Aufgabe entkoppelt, wodurch davon ausgegangen werden kann, dass 
er stets situationsbewusst handelt und durchgängig in der Lage ist, die Aufgabe vollständig 
zu übernehmen. Dies erlaubt die Verschiebung der Kontrolle, ohne die Aktion des Menschen 
explizit zu bewerten, da davon ausgegangen werden kann, dass seine Handlung exakt so be- 
absichtigt ist. Für die in dieser Arbeit betrachteten Szenarien der Kontrollübergabe an einen 
potenziell unaufmerksamen Menschen lassen sich diese Ansätze somit nicht direkt verwen- 


den, sondern können nur als Ausgangspunkt für weitere Arbeiten dienen. 


2.3 Haptic Shared Control basierte Übergaben der 
Fahrzeugführung 


Parallel zur Entstehung dieser Arbeit wurden zwei Ansätze entwickelt, die den Gedanken auf- 
greifen, die Transition der Fahraufgabe zwischen Fahrer und Automation durch eine Haptic 
Shared Control Phase zu realisieren. Die grundlegenden Ideen dieser beiden Ansätze und, so- 


weit vorhanden, erste Ergebnisse werden nachfolgend vorgestellt. 


Im Ansatz von Wada et al. [WSOS16] wird zunächst für Fahrer und Automation das als Pseudo- 
Arbeit bezeichnete Produkt von Lenkmoment und Lenkradwinkel gebildet. Aus dem Vergleich 
der ermittelten Größen mit vordefinierten Schwellwerten wird anschließend einer von vier 
möglichen kooperativen Zuständen bestimmt. Diese geben an, welcher der beiden Partner die 
Initiative über die Fahrzeugbedienung besitzt und ob die Intentionen der Partner konsistent 
sind. Befindet sich das System in einem Zustand, in dem der Mensch die Fahrzeugbewegung 
maßgeblich beeinflusst, die Automation jedoch in die entgegengesetzte Richtung steuert, wird 
eine Transition der Kontrolle zum Fahrer eingeleitet. Dafür wird der Verstärkungsfaktor der 
Differenz von Soll- und Ist-Lenkwinkel im Regler abhängig vom Lenkmoment des Menschen 
reduziert. Drei Parametrierungen der graduellen Abschaltung sowie eine sofortige Abschal- 
tung wurden in einem Experiment miteinander verglichen. Die Teilnehmer mussten in einem 
kleinen, hochautomatisiert fahrenden Elektrofahrzeug einen Spurwechsel durchführen und so 


die Übergabe initiieren. Die Ergebnisse des nur sechs Probanden umfassenden Experiments 
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zeigen geringere Lenkradwinkelgeschwindigkeiten, wenn das Moment der Automation lang- 


samer reduziert wird. 


Der Ansatz wurde anschließend auch in einem statischen Fahrsimulator untersucht [SWS17, 
SWS18]. Als Versuchsszenario wurde eine Situation gewählt, welche einen spontanen Ent- 
schluss des Fahrers, die nächste Abfahrt zu nehmen, abbilden soll. Die Probanden wurden da- 
für nicht durch eine Nebentätigkeit abgelenkt und sollten auf einen Signalton hin das Manöver 
durchführen. 24 Versuchsteilnehmer absolvierten das Szenario jeweils mehrfach manuell, mit 
sofortigem Abschalten der Automation, mit graduellem Abschalten der Automation und mit 
graduellem Abschalten der Automation und zusätzlicher Anzeige des Kooperationslevels über 
ein Vibrationsarmband. Die Ergebnisse der Studie zeigen, dass das Verfahren in der Lage ist, 
die Lenk- und Fahrzeugstabilität gegenüber dem sofortigen Abschalten signifikant zu verbes- 


sern. 


Zudem wurde der Ansatz auch für eine von der Automation initiierte Transition im Fahrsi- 
mulator getestet [WK17]. Die Probanden wurden diesmal während der automatisierten Fahrt 
durch Rechenaufgaben abgelenkt und angewiesen, nach der Übernahmeaufforderung die 
nächste Ausfahrt zu nehmen. Als Faktoren wurden zum einen der Startpunkt der Überga- 
be (direkt mit Übernahmeaufforderung oder erst nach Bestätigung durch den Fahrer mittels 
Tastendruck) und zum anderen die Übergabemethode (sofort oder graduell) untersucht. Die 
Analyse der Fahrten von vier Probanden zeigt deutlich geringere Standardabweichungen der 
Fahrzeugquerposition für die Variante, in der die Übergabe mit Tastendruck bestätigt wurde. 
Bezüglich des Faktors Startzeitpunkt der Übergabe erzielt die Shared Control Variante geringe- 
re Standardabweichungen als die sofortige Abschaltung. Dies zeigt laut Aussage der Autoren, 
dass es mit Hilfe von Shared Control möglich ist, einen stufenlosen Übergabeverlauf auch dann 


zu realisieren, wenn die Übergabe nicht durch den Fahrer bestätigt wird. 


Eine erste Idee für einen alternativen Ansatz verfolgen Lv et al. [LWC* 18]. Die Automations- 
funktion ermittelt hier die optimale Stellgröße mittels eines modellbasierten Prädiktivreglers 
und steuert die Differenz zwischen optimalem und vom Fahrer gestellten Moment vor. Zu- 
dem wird die gewünschte Beteiligung des Fahrers an der Fahraufgabe abhängig von dessen 
kognitiver Belastung und der Bereitschaft der Muskulatur berechnet. Abhängig von der Dif- 
ferenz der gewünschten zur tatsächlichen Beteiligung wird anschließend mit einem PI-Regler 
ein unterstützendes Moment der Automation berechnet und zusätzlich auf das Lenkrad ap- 
pliziert. Die Funktionsweise des Ansatzes wird durch eine Rechnersimulation verifiziert. Bis- 
her wurden jedoch keine Ergebnisse mit realen menschlichen Aktionen und entsprechenden 
online-fähigen Methoden zur Bestimmung der Soll-Beteiligung des Fahrers vorgestellt. Ohne 
ein entsprechendes Experiment, welches sowohl die praktische Umsetzbarkeit zeigt als auch 
Daten von der Interaktion des System mit dem Menschen liefert, lässt sich nicht beantworten, 
ob die Transition der Fahraufgabe von der Automation an den Menschen hierdurch verbessert 


werden kann. 
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Auch wenn die beiden Ansätze zeigen, dass eine Transitionsphase mit Hilfe von Haptic Sha- 
red Control von der Wissenschaft als geeignetes Mittel zur sicheren und komfortablen Gestal- 
tung des Ubergabeprozesses in Betracht gezogen wird, sind trotzdem noch mehrere Defizite 
der vorgestellten Methoden ersichtlich. Das Transitionsverfahren mittels der Pseudo-Arbeit 
[WSOS16, SWS17, SWS18, WK17] geht wie die Ansatze aus Abschnitt 2.2 von der Annahme 
aus, dass der menschliche Partner wahrend der Ubergabe korrekt handelt. Deshalb kann ihm 
bei Konflikten mit der Automationsfunktion die Kontrolle überlassen werden. Für vom Fahrer 
initiierte Übergaben in mehrfach trainierten Situationen stellt sich diese Annahme als gerecht- 
fertigt dar und der Ansatz liefert gute Ergebnisse [WSOS16, SWS17, SWS18]. Für unvorherge- 
sehene Aufforderungen an den Fahrer, das Fahrzeug zu übernehmen, wurde der Ansatz bisher 
nur unzureichend untersucht, jedoch erscheint die Berechtigung der Annahme hier zweifel- 
haft. Der Ansatz von Lv et al. aus [LWC* 18] eignet sich für diese Szenarien theoretisch besser, 
da er die Bereitschaft des Fahrers in den Transitionsprozess mit einbindet. Allerdings wurden 
bisher keine Ergebnisse von der Nutzung des Systems durch Probanden veröffentlicht. Aus 
diesem Grund lässt sich die Qualität der aktuellen Bereitschaftszustandsbestimmung des Men- 
schen und der darauf angepassten Transition nicht bewerten. Beiden Methoden gemein ist das 
Grundprinzip, zunächst den Zustand der Kooperation zu bestimmen und die Transition ent- 
sprechend anzupassen. Die Regler der Verfahren werden jedoch heuristisch ausgelegt, da den 
Ansätzen ein Modell fehlt, welches die Interaktion zwischen Mensch und Maschine explizit 
abbildet. Basierend auf einem solchen Modell könnte ein systematisches Reglerentwurfsver- 
fahren erstellt werden, welches die Besonderheiten der Interaktion berücksichtigt und so den 
idealen Transitionsverlauf erzeugt. Aus diesem Grund werden im nächsten Abschnitt bereits 


vorhandene Ansätze zur Modellierung der Mensch-Maschine-Interaktionen vorgestellt. 


2.4 Modellierung und Adaption von 
Mensch-Maschine-Interaktion mittels Spieltheorie 


Um die Interaktion zwischen Fahrer und Fahrzeug zu beschreiben, verwenden mehrere Auto- 
ren einen Ansatz, der auf Differentialspielen basiert [TAT11, NC13, FOSH14]. Sie modellieren 
die Kooperationspartner als Spieler, welche mit dem Fahrzeug und über die Stellglieder auch 
haptisch miteinander interagieren, dabei jedoch individuelle Ziele verfolgen. Unter Berück- 
sichtigung des Fahrzeugmodells sowie der wechselseitigen Ziele einigen sich die Spieler auf 
ihre Stellgrößen. Die Ansätze werden jedoch bisher ausschließlich für eine dauerhafte Ko- 
operation mit Hilfe von Haptic Shared Control angewendet. Mensch und Maschine besitzen 
hierbei statisch vordefinierte Rollen, nach denen sie durchgehend handeln. Für diesen Anwen- 
dungsfall zeigen diese Konzepte vielversprechende Ergebnisse. Eine Erweiterung der Model- 
lierung für wechselnde Rollen der Spieler, also somit auch für die vollständige Übergabe der 


Fahraufgabe an den Menschen bei Erreichen der Systemgrenze, existiert jedoch noch nicht. 
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Sollen auch derartige Rollenwechsel abgebildet werden, ist eine Erweiterung der Modellie- 
rung erforderlich. Die nachfolgenden Quellen stellen erste Ansätze vor, die Differentialspiele 


auch zur Nachbildung der Adaption eines Partners an den anderen nutzen. 


Shen und Cruz Jr. [SCJ08] verwenden dazu das iterative Prinzip des Ficticious Play, d.h. die 
Spieler agieren zunächst basierend auf einer Annahme und beobachten die entsprechende Re- 
aktion des Partners. Auf Basis dieser Beobachtung wird anschließend das Modell modifiziert 
und eine neue Iteration unter der neuen Annahme durchgeführt. Die Funktionsweise wird 


durch Simulation mit einem fiktiven System demonstriert. 


Li et al. [LTC*15] stellen die These auf, dass eine Kooperation genau dann koordiniert ist, 
wenn die Kooperationspartner die identische Vorstellung davon besitzen, wie das Ziel erreicht 
werden soll, d.h. auch darüber, wie die Aufgabe zwischen den Partnern verteilt wird. Deshalb 
adaptieren sie in ihrem Ansatz das Ziel der Automation im Differentialspiel in der Art, dass die 
aus dieser Aufgabenverteilung resultierende Stellgröße des Menschen genau dem tatsächlich 
aufgebrachten Wert entspricht. Zwar ermöglicht das Verfahren die Verschiebung des jewei- 
ligen Anteils der Partner an der Aufgabe, jedoch keine vollständige Übertragung an einen 
der beiden Beteiligten. Die Anwendung erfolgte in einem Experiment, in dem gemeinsam mit 
einem Roboter einer Trajektorie gefolgt werden soll. Die Analyse der Ergebnisse von zehn 
Probanden zeigt, dass es mit der Methode möglich ist, einen guten Kompromiss zwischen dem 
Stellaufwand des Menschen und dem Positionierungsfehler zu erzeugen, während bei festen 


Rollen stets die Reduzierung eines der beiden Kriterien bevorzugt wird. 


Beide vorgestellten Verfahren bedienen sich Differentialspielen mit unbegrenzter Dauer. Die- 
ser Spezialfall ermöglicht es, einen expliziten funktionalen Zusammenhang zwischen den Zie- 
len und den Stellgrößen der Partner anzugeben, der jeweils die Grundlage für das anschließen- 
de Adaptionsverfahren bildet. Für die Anwendung im Straßenverkehr, in der die Verkehrssi- 
tuation und daraus abgeleitet auch die Ziele der beiden Partner nur für einen sehr beschränkten 
Zeitraum vorhersehbar sind, kann dieser Spezialfall nicht genutzt werden. Aus diesem Grund 
sind die Verfahren nicht zur Abbildung von Adaptionsprozessen in diesem Anwendungsbe- 


reich geeignet und neue Ansätze müssen hierfür entwickelt werden. 


2.5 Wissenschaftliche Lücke und Forschungsfrage 


Die Ausführungen zu Beginn dieses Kapitels zeigen, dass die Übergabe der Fahraufgabe an 
Systemgrenzen zurück an den Menschen einen Risikofaktor des hochautomatisierten Fahrens 
darstellt. Mit Hilfe einer intelligenten Transitionsphase kann dieses Risiko gegebenenfalls re- 
duziert werden. Die in Abschnitt 2.2 vorgestellten Veröffentlichungen zeigen, dass sich das 


Konzept des Haptic Shared Control in diversen Anwendungsbereichen gut dazu eignet, um 
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Menschen beim Aufbau des Situationsbewusstseins zu helfen und sie bei der Erfüllung der 


Aufgabe zu unterstiitzen. 


Der Fokus bestehender Ansatze liegt hierbei jedoch auf Anwendungen, die kontinuierlich eine 
gemeinsame Ausführung einer Aufgabe von Mensch und Maschine beinhalten und somit nicht 
auf die Fälle übertragbar sind, in denen die Verantwortung über die Aufgabe vollständig von 
einem Partner an einen potenziell unaufmerksamen Partner übergeben wird. Zwar existieren 
erste Ansätze (s. Abschnitt 2.3), die Haptic Shared Control für Transitionen im hochautoma- 
tisierten Fahren nutzen, jedoch liegt diesen Methoden kein systematischer Reglerentwurf zu- 
grunde, der die Kooperation explizit modelliert und für die Aktion der Automation berücksich- 
tigt, um einen idealen Transitionsverlauf zu erzeugen. Zudem fehlen aussagekräftige Studien, 
welche die Leistung einer Haptic Shared Control basierten Übergabe in relevanten Fahrsitua- 


tionen aufzeigen. 


Die vorhandenen Ansätze zur expliziten Modellierung von Kooperation und dynamischer 
Adaption innerhalb eines solchen Frameworks aus Abschnitt 2.4 sind auf dauerhafte Koope- 
rationen beschränkt oder aufgrund ihrer Limitierung auf einen mathematischen Spezialfall 
ebenfalls für die Unterstützung des Menschen während der Übernahme einer Aufgabe in un- 


vorhergesehenen Situationen ungeeignet. 


Fasst man den Stand der Wissenschaft zusammen, erkennt man, dass keine geeigneten Kon- 
zepte zur Gestaltung einer Automation existieren, welche den Menschen bei der unerwarte- 
ten Übernahme einer Aufgabe effizient unterstützen. Das Ziel dieser Arbeit ist es, diese For- 


schungslücke zu schließen. 


Um unter diesen Gesichtspunkten die in Kapitel 1 formulierte Leitfrage nach Gestaltungs- 
empfehlungen für die Unterstützung bei der Übernahme einer Aufgabe umfassend zu beant- 
worten, müssen folglich zunächst allgemeine methodische Konzepte entwickelt und diese im 
Anschluss für die konkrete Anwendung validiert werden. Daraus ergeben sich die folgenden 


vier Forschungsfragen dieser Arbeit: 


1. Wie lässt sich die dynamische Verteilung einer Aufgabe in der Interaktion zwischen 


Mensch und Maschine modellieren? 


2. Wie lässt sich eine Automation realisieren, welche die Übernahmefähigkeit des Men- 


schen anhand dessen Aktion erkennt und ihre eigene Leistung entsprechend anpasst? 


3. Wie lassen sich die neuen Konzepte auf praktische Fragestellungen wie die Übergabe 


bei hochautomatisiertem Fahren anwenden? 


4. Wie wirken sich diese Konzepte im realen Zusammenspiel mit dem Menschen aus und 


können sie den Transitionsprozess nachweisbar verbessern? 
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Mit der Beantwortung dieser Fragen befassen sich die nachfolgenden Kapitel. Die Vorstellung 
des Modellierungsansatzes (erste Frage) erfolgt in Kapitel 3. Darauf aufbauend wird in Kapitel 
4 die zweite Frage geklart und ein neuartiges Verfahren fiir die Adaption des Ubergabeverlaufs 
an die aktuelle menschliche Reaktion gezeigt. Die letzten beiden Fragen werden in Kapitel 5 
beantwortet, in dem die Anwendung und Bewertung der entwickelten Konzepte mit Hilfe von 


Fahrsimulatorexperimenten vorgestellt wird. 


3 Modellierung von Ubergaben unter 


Verwendung von Differentialspielen 


Im nachfolgenden Kapitel wird die Modellierung vorgestellt, mit der in dieser Arbeit die In- 
teraktion zwischen Mensch und Automation beschrieben wird. Zudem wird erlautert, wie 
über diese Modellierung Ubergaben nachgebildet werden können. Die Beschreibung erfolgt 
über Differentialspiele, da diese, wie in Abschnitt 2.4 dargelegt, gute Ergebnisse für die Ab- 
bildung von Mensch-Maschine-Interaktion liefern. Differentialspiele stammen aus dem Ge- 
biet der Spieltheorie, weshalb zunächst in Abschnitt 3.1 die notwendigen spieltheoretischen 
Grundlagen erläutert werden, bevor anschließend in Abschnitt 3.2 der Aufbau von Differenti- 
alspielen und deren Lösung behandelt werden. In Abschnitt 3.3 erfolgt der Übertrag der ma- 
thematischen Formulierung auf die Mensch-Maschine-Interaktion, sowie die Umsetzung von 
Übergaben innerhalb dieses Frameworks. Die Modellierungsmethode und deren Anwendung 
im Kontext des hochautomatisierten Fahrens wurden bereits in [LGFH17] und [LMH* 18] ver- 
öffentlicht. Den Abschluss des Kapitels bildet ein Simulationsbeispiel in Abschnitt 3.4, anhand 


dessen die Möglichkeiten der erarbeiteten Beschreibungsform aufgezeigt werden. 


3.1 Spieltheoretische Grundlagen 


Die Spieltheorie ist eine mathematische Disziplin, welche die Analyse von strategischen Ent- 
scheidungssituationen (= Spielen) behandelt, in denen mehrere, rational agierende, Entschei- 
dungsträger (= Spieler) das Ergebnis beeinflussen. Während sich die Disziplin anfangs mit 
der namensgebenden Untersuchung von Gesellschaftsspielen beschäftigte [Neu28], erweiter- 
te sich das Anwendungsgebiet schnell auf andere Bereiche wie Ökonomie, Soziologie, Biologie 
und Informatik, in denen Fragestellungen mit mehreren Entscheidern eine große Rolle spie- 
len. Nachfolgend werden die für diese Arbeit relevanten Aspekte der Spieltheorie vorgestellt. 
Eine ausführlichere Einführung ist beispielsweise in den Werken [BW16, Bau16, HI06, Meh07, 
Win15] zu finden. 
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Um für jeden Spieler i angeben zu können, welche Aktion (= Strategie) u; ausgewählt werden 


4 


sollte, um seine Kostenfunktion J (un, ..., uj,..., uy) zu minimieren“, muss das Spiel zunächst 


vollstandig beschrieben werden: 


Definition 3.1 (Spiel) 
Ein Spiel T = (P, U, J) wird nach [HI06, S.4] vollständig beschrieben durch 


e die Menge der Spieler P = {1,..., N}, 


e den Strategieraum U, der die Menge aller möglichen Strategiekombinationen u = 
{un,..., un} der Spieler angibt, 


e die Kostenfunktionen J = {Jı,...,Jn } aller Spieler und 


e die Spielregeln. 


Die Spielregeln definieren die Eigenschaften des Spiels wie beispielsweise die Handlungszeit- 
punkte (simultan/sequentiell) oder den Wissensstand (vollständige Information/unvollständige 
Information) der beteiligen Spieler und legen dadurch die möglichen Lösungskonzepte fest. Ei- 
ne grundlegende Unterscheidung der Methoden erfolgt hierbei durch die Erlaubnis bzw. das 
Verbot für die Spieler, bindende Verträge untereinander einzugehen, d.h. dass die Spieler ihre 
Strategien verbindlich vereinbaren können. Erlaubt das Spiel diese Art der Absprachen, kann 
die Analyse über das Teilgebiet der kooperativen Spieltheorie erfolgen. Die zentralen Frage- 
stellungen lauten dann, welche Strategiekombination vereinbart und wie deren Kosten unter 
den Spielern aufgeteilt werden sollten. Eine gute Einführung hierzu gibt [Win15, Kapitel 7]. 
Die in dieser Arbeit behandelte Interaktion zwischen Mensch und Automation gestattet diese 
Art von Absprachen jedoch nicht, wodurch sie in das zweite Teilgebiet, die nicht-kooperative 
Spieltheorie, fällt. Auch wenn es zunächst paradox erscheinen mag, Kooperation mit nicht- 
kooperativer Spieltheorie zu beschreiben, sei darauf hingewiesen, dass auch dieses Teilgebiet 
nicht ausschließt, dass die Partner ein gemeinsames Ziel verfolgen bzw. sich bei der Errei- 
chung ihrer individuellen Ziele unterstützen. Da keine Möglichkeit besteht, bindende Verträge 
zu schließen, muss das Resultat jedoch selbsterhaltend sein, d.h. die Spieler müssen sich ba- 
sierend auf ihren individuellen Kostenfunktionen auf eine Strategiekombination einigen. Um 
eine formelle Beschreibung eines solchen Resultats zu erhalten, wird zunächst die Definition 


der besten Antwort gegeben: 


Üblicherweise nutzt die Spieltheorie Auszahlungsfunktionen, die maximiert werden sollen. In dieser Arbeit wird 
jedoch die in der Optimierungstheorie übliche Beschreibung von Kosten verwendet, die naturgemäß minimiert 
werden sollen. Die Beschreibungen können ohne Weiteres über den geltenden Zusammenhang max J = min(-/) 
ineinander überführt werden. 
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Definition 3.2 (Beste Antwort) 


Eine Strategie u; € U; heißt beste Antwort auf eine gültige Strategiekonstellation der anderen 
Spieler uj = {uı,..., ui-1, Ui+1,..., un }, falls für jede andere Strategie u; gilt: 


Ji(ui,...,Uj,..., UN) < Ji(un,...,ui,..., UN), mit u € U (3.1) 


Es handelt sich also für Spieler i um genau die Strategie bzw. Strategien, die für eine gege- 
bene Strategie der Mitspieler die eigene Kostenfunktion minimieren. Eine einseitige Ände- 
rung der Strategie dieses Spielers kann somit keine weitere Reduktion seiner Kosten erzielen. 
Damit eine Strategiekombination selbsterhaltend ist, müssen die Spieler wechselseitig eine 
beste Antwort wählen, wodurch es für keinen Spieler möglich ist, durch eine abweichende 
Handlung eine Verbesserung zu erzielen. Daraus ergibt sich das zentrale Lösungskonzept der 
nicht-kooperativen Spieltheorie, welches das von John Nash 1951 aufgestellte und nach ihm 
benannte Nash-Gleichgewicht ist [Nas51]. Es wird nach [Eng05, S. 263] definiert zu: 


Definition 3.3 (Nash-Gleichgewicht) 


Eine zulässige Kombination von Strategien u" = {u}, ..., uy} wird als Nash-Gleichgewicht 


bezeichnet, wenn für jede zulässige Strategiekombination gilt: 


Ju] ,...,u;,...,un) < Ji(uj,..., ui,...,un) Vi € P (3.2) 


Je nach Wahl der Elemente eines Spiels kann dieses kein, ein oder mehrere Gleichgewichte 
haben. Zudem kann ein Nash-Gleichgewicht auch ineffizient sein, d.h. beide Spieler konnten 
jeweils eine höhere Auszahlung erreichen, wenn sie sich stattdessen auf eine nicht selbster- 
haltende Strategiekombination einigen könnten, wie das berühmte Beispiel des Gefangenen- 
dilemmas veranschaulicht [Kol98]. 


Aufgrund der erfolgreichen Verwendung von Differentialspielen zur Modellierung der Inter- 
aktion zwischen Mensch und Automation (vgl. Abschnitt 2.4) wird diese Beschreibungsform 
auch in der vorliegenden Arbeit eingesetzt. Im nachfolgenden Abschnitt werden deshalb zu- 
nächst die Struktur und Spielregeln des Differentialspiels erläutert, bevor anschließend Ver- 


fahren vorgestellt werden, um Nash-Gleichgewichte für diese Art von Spielen zu ermitteln. 
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3.2 Differentialspiele 


Die Erweiterung der Spieltheorie um nicht-kooperative Differentialspiele erfolgte erstmals 
durch Isaacs in den Jahren 1954 und 1955 im Rahmen von Zwei-Spieler-Nullsummenspielen, 
bei denen die Kosten eines Spielers zeitgleich dem Gewinn des anderen entsprechen und um- 
gekehrt [Isa54a, Isa54b, Isa54c, Isa55]. Die Verallgemeinerung auf Nicht-Nullsummenspiele 
erfolgte anschließend durch Starr und Ho [SH69b, SH69a]. Eine gute Einführung in die Thema- 
tik bieten [BO99, Bau16, Bre11, Eng05, Meh07], aus denen die wichtigsten Inhalte im Weiteren 


zusammengefasst wurden. 


In einem Differentialspiel beeinflussen die Spieler über die Wahl ihrer Strategien uj(t) ein Sys- 


tem, dessen Dynamik über die Differentialgleichung 


x(t) = £(t, x(t), u4(t),..., uy(t)) (3.3) 


beschrieben werden kann. Die Strategien der Spieler sind nun vektorielle Funktionen über der 
Zeit t. Das bedeutet, die Spieler können einerseits kontinuierlich während des Spiels ihre Ak- 
tionen ändern, andererseits über die Elemente des Vektors u;(t) auf verschiedene Weise auf das 
System einwirken. Analog zur Systemtheorie wird x(t) als Zustandsvektor und u;(t) nachfol- 
gend als Stellgrößenvektor des Spielers i bezeichnet. Die Kostenfunktionen der Spieler können 
von den Stellgrößen aller Spieler sowohl direkt als auch indirekt über die Beeinflussung der 
Zustände abhängen. Eine allgemeine Darstellung bietet das Bolza’sche Gütemaß, welches zum 
einen durch das Integral über der Funktion h den Trajektorienverlauf der Zustände und Stell- 
größen während des Spiels (t € [io, T]) berücksichtigt, zum anderen mittels der Funktion g 


auch den Endzustand in die Bewertung mit einfließen lässt [F6194]: 


T 


Jitu (t), ..., ui(t), ..., un(t)) = g&(T), 1) + | hex a,u (oat (3.4) 


to 


Das Ziel der Spieler ist folglich, das System ausgehend von Systemzustand xo zum Zeitpunkt 
t = to während der Dauer des Spieles so zu beeinflussen, dass ihre individuellen Kosten mini- 


mal werden. 


Eine populäre Klasse von Differentialspielen bilden die Linear-Quadratischen-Differentialspie- 
le (LQ-Differentialspiele), da diese bei Erfüllung entsprechender Voraussetzungen die Berech- 


nung von expliziten Lösungen für die optimalen Strategien der Spieler erlauben [Bau16]. In 
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dieser Klasse von Differentialspielen lässt sich die Dynamik des Systems über eine lineare Zu- 


standsdifferentialgleichung der Form 


N 
(t) = A(Ox(t) + Y B)al) (3.5) 
i=1 
beschreiben und die Spieler optimieren ein Bolza’sches Gütemaß in quadratischer Form ge- 
mäß 
1 if ` 
Ji= „x (DS:x(T) 5 [was + > u; (t)Ri(t)u,(t)dt. (3.6) 
0 j=1 


Aus Gründen der Übersichtlichkeit wird die explizite Angabe der Abhängigkeit der Vektoren 
und Matrizen von der Zeit t im Folgenden vernachlässigt und deren Wert zum Zeitpunkt T 
durch den Index T dargestellt. 


Da alle Spieler die Absicht haben, ihr eigenes Gütemaß zu minimieren, entsteht ein gekop- 
peltes Optimierungsproblem. Im Rahmen dieser Arbeit soll ein solches Differentialspiel zur 
Modellierung der Interaktion von Mensch und Automation genutzt werden, weshalb nachfol- 
gend der Fall für zwei Spieler betrachtet wird. Um abbilden zu können, dass die Spieler das Ziel 
haben, den Systemzustand einer individuellen, potenziell zeitvarianten Referenztrajektorie X; 
folgen zu lassen, werden die Gütemaße zudem modifiziert. Statt einer direkten Bestrafung des 
Systemzustands wird dessen Abweichung zu dieser Referenztrajektorie bestraft. Damit ergibt 


sich folgende Beschreibung eines Zweispieler LQ-Differentialspiels mit Zustandsreferenzen: 


Definition 3.4 (Zweispieler LQ-Differentialspiel mit Zustandsreferenzen) 


Im Zweispieler LQ-Differentialspiel mit Zustandsreferenzen interagieren zwei Spieler mit 


dem Ziel, ihre quadratischen Giitefunktionen Jı und Jz der Form 


T 


2 
1 1 
Ji = 5 (xr - X17)! Si(xr - X1,T) + > fe -&) Qix -Xı)+ Y,wjRımidt (3.7a) 
0 i=1 
T 


1 1 
27,073 x%,,1)' S2(X7 - 2,7) + fe - X2)" Q2(x - X2) + J uj Rz;ju;dt  (3.7b) 
0 i=1 
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zu minimieren. Der Zustandsvektor wird ausgehend vom Startzustand xo über ein lineares 


Zustandsraummodell von den Spielern beeinflusst: 


x = Ax + Byu, + Boug (3.7c) 
x(0) = Xo. (3.7d) 


Die Gleichungen (3.7c) und (3.7d) bilden die Nebenbedingungen für die Optimierung 
u] =arg min Ji (3.7e) 
1 


u, = arg min Jz. (3.7£) 
uz 


In den beiden folgenden Abschnitten werden Methoden vorgestellt, mit denen sich Strategie- 
kombinationen (uj, u3) berechnen lassen, die ein Nash-Gleichgewicht des Optimierungspro- 
blems aus Definition 3.4 bilden. Zudem werden Aussagen tiber die Existenz und Eindeutigkeit 
der Lösung für die entsprechenden Verfahren getätigt. Für die Lösungsmethoden wird eine 
offene Informationsstruktur angenommen, d.h. die Lösung erfolgt als Steuerung basierend auf 
dem Startzustand und den Modellannahmen über die Spieler und das System. Die Verfahren 


lassen sich analog auch für Problemstellungen mit mehr als zwei Spielern anwenden. 


3.2.1 Lösung mit Hilfe des Hamilton-Ansatzes 


Eine Möglichkeit, die optimalen Stellgrößen der beiden Spieler zu berechnen, liefern die Me- 
thoden der dynamischen Optimierung. Dazu muss die Darstellung mit Zustandsreferenzen 
zunächst in die linear-quadratische Form entsprechend der Gleichungen (3.5) und (3.6) um- 
gewandelt werden. Dies erfolgt, indem die Anzahl der Zustände durch eine Erweiterung des 
Zustandsvektors verdoppelt wird [Eng05, S. 101 ff.]: 


x = | j | (3.8) 
Für die zusätzlichen Zustände Xext gilt 


kext = 0 (3.9) 
Xext(0) = 1, (3.10) 


d.h. alle Eintrage des Vektors besitzen durchgehend den Wert 1. 
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Damit lässt sich das Differentialspiel aus Definition 3.4 umschreiben in die Form 


T 
2 
Š 1 7 
Jı = <XrS1XT + TES Y,ujRımjdt (3.11a) 
2 4 i=l 
ji 2 
A 1 à 
h= -xl S2žT + TE + X uj Rojuidt (3.11b) 
i i=1 
mit der erweiterten Systemgleichung 
x = Ax + Byu, + Baus, (3.11c) 
dem Startzustand 
%(0) = | (3.11d) 
sowie den Matrizen 
- JA 0 ~ |B; 5 i -diag(x] Q; 
2 Be | Qr 7 iag(x; Qi) (3.11e) 
0 0 0 -diag(&; Qi) 0 
und 
P S; -diag(x/ Si) 
ol ee ae ee 2 ; (3.11f) 
-diag(X; 7Si) 0 


Zur Lösung dieser Problemstellung lässt sich der Hamilton-Formalismus verwenden [Kir04, S. 
187 f.], [PLB15, S. 295 ff.]. Mit Hilfe der Lagrange-Multiplikatoren A; wird dazu die Hamilton- 
Funktion H; für jeden Spieler i aufgestellt: 


if... è er ad 
H; =- > (xox + X oR) +A} (as + X: B) (3.12) 
jl ja 
Als Optimalitätsbedingungen ergeben sich damit für jeden Spieler die Koppelgleichung 


OH; 
au; 


=- Riju; + B/A; =0 (3.13) 
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sowie die kanonischen Differentialgleichungen 


En OH nr 2 D 
x= = Ax + Bu; 3.14 
u AH Zn 614) 
und 
i ðH; 8 = 
Aj = -— = OK -AlAj. (3.15) 
Ox 


Zudem gilt fiir die Lagrange-Multiplikatoren A; am Ende des Optimierungshorizonts 


ives R 
Kine (575%) - 8%. (3.16) 
ox \2 
T 
Gleichung (3.13) kann nach u; aufgelöst werden zu: 
u; =R} B] Ai. (3.17) 


Weiterhin wird zur Losung des Differentialgleichungssystems (3.14) und (3.15) der Ansatz 
A; = -Pix (3.18) 
gewahlt. Eingesetzt in (3.15) erhalt man durch Anwenden der Produktregel: 
-P;x - P;x = Ox + A' Pix (3.19) 


Setzt man nun in Gleichung (3.19) nacheinander die Gleichungen (3.14), (3.17) und (3.18) ein, 


erhalt man fiir jeden Spieler eine Gleichung der Gestalt 
(Pi + A'P; + PA - PiB;R; BIP; - PBR; B] P; + Qi) x = 0, (3.20) 


welche jeweils für alle x erfüllt sein muss. Das ist gleichbedeutend damit, dass der Term in 
den Klammern gleich Null ist. Dies wird wiederum genau durch die Kombination von Pı und 
P» erfüllt, welche das, aus den gekoppelten Riccati-Differentialgleichungen bestehende, Glei- 


chungssystem 


Pi =- A'P, - PıÄ + P1B2R53B3 P2 + P:B, Rj} B] P: - Qı (3.21a) 


P = - A'P» - P2A + PaBıR] I BI Pı + P2B2R53B3 P2 - Q2 (3.21b) 
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mit den Endwerten 


Pı(T) = Sı (3.21c) 
P2(T) = 52 (3.21d) 


löst. Die Endwerte folgen hierbei aus dem Vergleich von Gleichung (3.16) und dem Ansatz 
(3.18). 


Nur wenn das Differentialgleichungssystem (3.21) eine Lösung besitzt, existiert ein entspre- 
chendes Nash-Gleichgewicht für einen beliebigen Startzustand xo. Dieses ist dann eindeutig 
[Eng05, S.274 f]. Da diese Lösung im Allgemeinen nicht analytisch bestimmt werden kann, 
müssen die Matrizen P; in der Regel numerisch, beispielsweise mit einem Euler-Verfahren, 


berechnet werden. 


Die optimalen Stellgrößentrajektorien der beiden Spieler ergeben sich anschließend unmittel- 
bar durch Einsetzen von (3.18) in (3.17) zu 


uj = -Rj/BIPıx (3.22a) 
u% = - R23B3 Pox (3.22b) 


unter Verwendung der mit Hilfe von (3.21) berechneten Matrizen Pı und P2. 


3.2.2 Lösung mit Hilfe des Batch-Ansatzes 


Alternativ lässt sich das Differentialspiel lösen, indem das dynamische Optimierungsproblem 
(3.7) durch Diskretisierung zunächst in ein Parameteroptimierungsproblem umgewandelt wird. 
Für eine Abtastzeit r = T/N können die Spielergütemaße mit einer Quadraturformel appro- 
ximiert werden. Mit der linksseitigen Rechteckformel aus [BSMMO08, S. 969] ergibt sich bei- 


spielsweise die diskretisierte Darstellung zu 
1 2 13 = 
Ji= 5(&Nn - Xin) Sin ~ Xin) 


+ 


N| =e 


N-1 2 

= oT = T 
by (œ - Rp) TQ K(x - Kin) +), Rum) (3.23) 
k=0 j=l 


wobei LI, bzw. []; den Wert der zugehörigen Matrix bzw. des zugehörigen Vektors LI bzw. 


i in Abtastschritt k bezeichnet. Alternativ lässt sich Gleichung (3.23) in folgender Matrixno- 


tation darstellen: 


2 
png RT jhe Tk 1 STs 
Ji = =(K- x) Oi(x - Xi) + 3 5 ü; Ryjüj (3.24) 
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mit den Vektoren 


Xo Xi,0 uo 
> _ |X] = Xi1| > u 
x = . [Xi > ‚Uj = 
XN Xi, N UN-1 
sowie den Matrizen 
[TQ o 0 a0 o] [TR;jo 0... 0 
ö 0 x : R 0 
LS > Aij K 
TQiN-1 0 E 0 
0 er 0 Si 0 Sas 0 TRij,N-1 


Die zeitdiskrete Systemmatrix ® und die zeitdiskreten Eingangsmatrizen H; ergeben sich für 


Systeme mit det A + 0 aus ihren kontinuierlichen Entsprechungen gemäß [Lun14, S. 444] zu 
D = e^ (3.25) 
und 
H; = A !(® - I)B;, (3.26) 


woraus die folgende zeitdiskrete Zustandsraumdarstellung resultiert: 


2 
Xk+1 = Ox, + X Hiu; k (3.27) 
i=1 


Auf dieses umformulierte Problem lässt sich nun der Batch-Ansatz anwenden [BBM17, S. 164 
f.]. Durch iteratives Einsetzen von Gleichung (3.27) lassen sich zunächst alle zukünftigen Zu- 


stande in Abhängigkeit des Startzustands xp und der Steuerfolgen der Spieler u; ausdrücken: 


2 
X = xo + > Hyu; (3.28) 
i=1 
mit 
I 0 .. 0 
® H; 0 


oN NH; .. ®H; Hi 
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Damit lässt sich die Zustandsfolge über den Optimierungshorizont X in den Gütemaßen der 
Spieler J; aus Gleichung (3.24) ersetzen, wodurch diese nur noch vom Startzustand xp und den 


Eingangsgrößen der Spieler u; abhängig sind. Somit ergibt sich für Spieler i: 


= 
2 2 2 

1[ as 2 a [2 a 19-17 = 

Ji = 3 (èx + > Hju; = zı) Q; (èx + SS Ayu; = z) + 2 5 H jüj (3.29) 
j=1 

Als notwendige Bedingung für ein Minimum von J; muss der Gradient von J; bezüglich der 


Optimierungsvariablen u; null sein. Für den Gradienten von Spieler i gilt: 


Jh esse 2st og Bae sy Sst > 
gg, 7 (Hi QH; + Riis + Hy Osi; + H; Qi(®xo - X;) (3.30) 
L 


Anhand der Gleichung (3.30) ist zu erkennen, dass die Lage des Optimums von der Stellgröße 
des jeweils anderen Spielers i abhängt. Da sich gemäß der Definition des Nash-Gleichgewichts 
3.3 jeder Spieler in einem Minimum befinden muss, werden die Berechnungen analog für jeden 
Spieler durchgeführt und in einem Gleichungssystem zusammengefasst. Für den hier vorge- 
stellten Fall mit zwei Spielern ergibt sich: 


>x 


H] QiHi + Ri H] QiH2 új 


ai, en, =0 (3.31) 
H? Q2Hı H? Q2H? + R22 


H] Q1(@x0 = 5) 


u; H] Q2(®xo - X2) 


Stellt man dieses Gleichungssystem nach den optimalen Steuerfolgen der Spieler u; um, erhält 


man unmittelbar die Berechnungsvorschrift für das Nash-Gleichgewicht: 
uy 
ú; 


Für ein System mit n Zuständen, m; Stellgrößen von Spieler i und einem Zeithorizont mit 


a ks BER 1 
Cr MT 
H) Q2H: H} OH; + R22 


er H] Qi (xo - ¥1) 
H) Q2(®xo - X2) 


(3.32) 


N Schritten muss folglich eine (mıN + mN) x (mıN + m2N)-Matrix invertiert werden, um 
die optimalen Stellgrößenverläufe zu ermitteln. Nur wenn diese Inverse existiert, existiert 
auch ein Nash-Gleichgewicht für die beiden Spieler. Durch die Inversion dieser Matrix ist 
der Batch-Ansatz für lange Zeithorizonte rechenaufwendiger als die numerische Lösung der 
Riccati-Differentialgleichungen aus dem Hamilton-Ansatz (jeweils N-malige Berechnung der 
2n x 2n-Matrizen P;). Die Lösung mittels des Batch-Ansatzes stellt jedoch ein allgemeineres 
Lösungsverfahren dar, in das weitere Nebenbedingungen integriert werden können, wie bei- 
spielsweise in [Fla16] erfolgt. 
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Nachdem in diesem Abschnitt der Aufbau von Differentialspielen und Ansätze für deren Lö- 
sung vorgestellt wurden, wird im Folgenden die Anwendung der Grundlagen zur Beantwor- 


tung der ersten Forschungsfrage dieser Arbeit erläutert. 


3.3 Anwendung von Differentialspielen zur Modellierung 
von Interaktion mit Übergaben 


Analog zu den Arbeiten aus Abschnitt 2.4 wird auch in dieser Arbeit die Modellierung der 
Mensch-Maschine-Interaktion mit Differentialspielen verfolgt. Diese Beschreibungsform ist 
durch die Forschungsergebnisse aus [TJ02, MTL10] motiviert, die zeigen, dass das Bewegungs- 
verhalten des Menschen als optimal bezüglich einer Gütefunktion betrachtet werden kann. Die 
Quellen belegen, dass sich mit den als Optimalregler aufgestellten Modellen die Trajektorien 
der menschlichen Aktion präzise beschreiben und prädizieren lassen. Ein Optimalregler ist 
auch eine sehr allgemeine und flexible Möglichkeit, eine Automation umzusetzen, welche auf 
Basis eines Systemmodells die Aufgabe entsprechend der Gütefunktion optimal erfüllt. Durch 
die Kombination eines als Optimalregler modellierten Menschen mit einer ebenso ausgeleg- 
ten Automation, welche beide auf ein gemeinsames System einwirken, liegen alle notwendigen 
Bestandteile für die Beschreibung der Interaktion als Differentialspiel vor. Wendet die Automa- 
tion in diesem Szenario eine Strategie an, die Bestandteil eines Nash-Gleichgewichts ist, ergibt 
sich folglich ein solches Gleichgewicht nur dann, wenn der Mensch mit seiner besten Antwort 
gemäß Definition 3.2 auf diese Strategie reagiert. Die Ergebnisse von Inga et al. [IFH19] zeigen, 
dass die Beschreibung als Differentialspiel das Verhalten von Testpersonen tatsächlich besser 
abbilden kann als eine Modellierung der Interaktion, welche die Stellgrößen des Partners als 


bekannte Störgrößen auffasst. 


Um nun das menschliche Verhalten bei der Ermittlung der optimalen Stellgröße der Automa- 
tion zu berücksichtigen, muss ein Modell des Menschen in Form eines Gütemaßes innerhalb 
der Automation vorliegen. Zusammen mit einem Modell der Regelstrecke und der Zielvorgabe 
der Automation lässt sich so ein Differentialspiel aufstellen. Dessen Lösung ergibt dann den 
optimalen Stellgrößenverlauf der Automation bei Kooperation mit diesem Partner für das vor- 


gegebene System. In Abbildung 3.1 wird die Interaktionsstruktur grafisch veranschaulicht. 


Die Kommunikation mit dem Menschen erfolgt durch haptische Interaktion über das, für Hap- 
tic Shared Control obligatorische, gemeinsame Stellglied, wodurch dem Menschen zu jedem 
Zeitpunkt die Aktion der Automation mitgeteilt wird. Die Berechnung der optimalen Stellgrö- 
ße der Automation erfordert keine Messung der Stellgröße des Menschen, da über das Modell 
innerhalb der Automation das menschliche Verhalten abgebildet wird und so trotzdem eine 
Antizipation und darüber hinaus eine Prädiktion zukünftiger Aktionen des menschlichen Ko- 


operationspartners erfolgen kann. 
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MENSCHLICHER PARTNER 


SYSTEM 


AUTOMATION 


lost Differentialspiel 

bestehend aus: 

— Modell des Menschen 

— Gütefunktion der Automation 
— Systemmodell 


Abbildung 3.1: Struktur der Mensch-Maschine Interaktion in einem Shared Control Szenario bei Auslegung der Au- 
tomation mit Hilfe eines Differentialspiels 


Im Folgenden wird vorgestellt, wie sich mit Hilfe einer Modifikation der Modellierung eine 
kooperative Transitionsphase umsetzen lässt. Bei einer kooperativen Transition wechselt die 
Aufgabenerfüllung von einem Partner zum anderen, wobei die Aufgabe während des Überga- 
beprozesses jedoch kooperativ gelöst wird, indem sich beide Partner an der Aufgabe beteiligen. 
Der Grad, mit dem ein Partner sich an der gemeinsamen Aufgabe beteiligt, wird dabei von den 
Gewichtungsmatrizen der Gütefunktionen (3.7a) und (3.7b) beeinflusst. Die Beteiligung hängt 
zum einen vom Verhältnis der Einträge der Zustandsgewichtungsmatrix Q zu denen der Stell- 
größengewichtungsmatrix R der eigenen Gütefunktion ab. Zum anderen ist sie abhängig vom 
Verhältnis der entsprechenden Einträge in der Gütefunktion des Partners. Wenn die Aufgabe 
von einem Kooperationspartner an den anderen übergeben werden soll, verändert sich der Be- 
teiligungsgrad der beiden Partner. Folglich müssen auch diese Verhältnisse in den Gütemaßen 
variiert werden, um dies im Modell korrekt abzubilden. Dazu wird zunächst definiert, wie eine 


Transition idealerweise verläuft. 
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Definition 3.5 (Ideale Transition) 


Als ideale Transition wird eine Ubertragung einer Aufgabe zwischen zwei Partnern definiert, 
wenn sich dieser Ubergabeprozess nicht auf die Systemzustände auswirkt. Dies ist gleichbe- 
deutend damit, dass sich die gemeinsame Beeinflussung des Systems während der Transition 
nicht von der Art und Weise unterscheidet, mit der ein Partner die Aufgabe alleine ausführen 
würde. 


Ausgehend von dieser Definition soll zuerst die Situation betrachtet werden, dass ein Partner 
sich gar nicht an der Aufgabe beteiligt (u; = 0), wie es beispielsweise bei einer abgeschal- 
teten Automation oder einem nicht zur Übernahme der Aufgabe bereiten Menschen der Fall 
ist. Die optimale Aktion des Spielers soll in diesem Fall darin bestehen, keine Stellgröße auf- 
zubringen. Um dies mit endlichen Gewichtungsparametern und unabhängig vom aktuellen 
Systemzustand zu erreichen, darf dieser Spieler weder Interesse an dem Wert der Zustände 
im Verlauf des Optimierungshorizonts haben, noch einen bestimmten Endzustand anstreben. 


Mathematisch ist das gleichbedeutend mit 
Qi = 0, vt € [0, T] (3.33) 
und 
Sj = 0. (3.34) 


Dies lasst sich im Hamilton-Ansatz leicht durch Einsetzen in Gleichung (3.21) zeigen, wodurch 
das entsprechende P; des Spielers immer gleich 0 bleibt und sich somit nach Gleichung (3.22) 
auch die optimale Stellgröße zu 0 ergibt. Im Batch-Ansatz ist dies sogar noch offensichtlicher, 
da die Werte zu 0; = 0 führen, wodurch aus Gleichung (3.32) unmittelbar Ryu; = 0 folgt. Dies 
ist nur für u} = 0 immer erfüllt. 


Es bleibt zu klären, wie sich die Einträge der Zustandsgewichtungsmatrizen der Spieler wah- 
rend der Transitionsphase verändern müssen, um eine ideale Transition abzubilden. Hierzu 
wird die kombinierte Stellgröße beider Spieler uj + u; für ein gemeinsam via Haptic Shared 
Control geregeltes System betrachtet. Da die Kooperationspartner über dasselbe Stellglied auf 
das System einwirken, gilt 


Bı = Bp =: B. (3.35) 


Weiterhin wird angenommen, dass beide Partner ihre einzelnen Stellgrößen im selben Ver- 


hältnis bestrafen, d.h. sie möchten die Aufgabe prinzipiell auf dieselbe Art erledigen und be- 
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vorzugen nicht unterschiedliche Eingriffe. Hierdurch können die beiden Gütemaße (3.7a) und 


(3.7b) bzgl. der Stellgrößengewichtungsmatrix normiert werden: 
Ry = Rz =: R (3.36) 


Im Fall einer einzelnen skalaren Stellgröße pro Spieler ist das immer möglich. 


Lemma 3.1 (Gemeinsame Aktion in einem Haptic Shared Control Differential- 
spiel) 

Gegeben sei ein Zweispieler LO-Differentialspiel mit Zustandsreferenzen gemäß Definition 
3.4. Beide Spieler wirken gemäß (3.35) über ein gemeinsames Stellglied auf das System ein 
und ihre Gütemaße können hinsichtlich der Stellgrößengewichtungsmatrix normiert werden, 
so dass Gleichung (3.36) gilt. 


In diesem Fall ist die Summe der optimalen Stellgrößen beider Spieler u = u} + us identisch 
mit der optimalen Steuergröße eines linear-quadratischen Optimierungsproblems mit den 
Gewichtungsmatrizen S := Sı + S2,Q := Q1 + Q2 undR. 


Haben die Spieler darüber hinaus dieselbe Referenztrajektoriexı = X? =: X, so ist diese auch 


identisch zur Referenztrajektorie dieses linear-quadratischen Optimierungsproblems. 


Beweis von Lemma 3.1: 
Die Summe der optimalen Stellgrößen unter den gegebenen Bedingungen ergibt sich mit dem 
Hamilton-Ansatz gemäß (3.22) zu 


uj +w=-R!B'Pıx+-R 1B! Pox = -R!B'(Pı + P2)x. (3.37) 
Sie ist also genau dann identisch zur optimalen Lösung eines einzelnen Spielers 
u* =-R!B'px, (3.38) 
wenn gilt 


P = P4 + P3. (3.39) 
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Für den Endwert P(T) folgt das für Š = 54 + Sy. Die Änderung von P entspricht dann 
P=P, +P». (3.40) 
Mit Hilfe der Gleichungen (3.21a) und (3.21b) folgt 


Pı +P, = - A'P, -P,A+P,BR !B' P, + P BR IBT P) - Q; 


- Ã' P; - P2A + PBR !B'Pı + PBR !B'P, - ©, (3.41) 
=-A(Pı + P3) - (Pı +P2)A 
+ (Pi ai P2)BR 'B! (P4 + P2) = (O1 + Q2) š (3.42) 


Gleichung (3.42) entspricht somit exakt der Riccati-Differentialgleichung im Einspieler-Fall 
P =-A'P-PA+PBR 'B'P-9Q, (3.43) 


wenn Q = Q; + O2. Anhand der Struktur von Q bzw. des Endwerts der Differentialgleichung 
Š (vgl. Gleichungen (3.11e) bzw. (3.11f)) folgt somit unmittelbar Q = Qı + Q2 und = S; + S2. 


Weiterhin folgt bei x; = X2 auch deren Gleichheit zur Referenztrajektorie x des vergleichbaren 


Ersatzproblems mit einem Spieler. 


Die Aussage über die gemeinsame Aktion gilt analog, falls das Zweispieler LQ-Differentialspiel 
mit Zustandsreferenzen entsprechend Abschnitt 3.2.2 mit Hilfe einer zeitdiskreten Darstellung 


approximiert wird: 


Lemma 3.2 (Gemeinsame Aktion in einem diskretisierten Haptic Shared Con- 
trol Differentialspiel) 

Die gemeinsame Aktion ù} + u, in einem diskretisierten Haptic Shared Control Differential- 
spiel entspricht der Lösung, die man durch Diskretisieren des linear-quadratischen Optimie- 
rungsproblems mit S := Sı + S2,Q := Qı + Q2 undR erhält. 


Gilt zusätzlich Xı = X2 := X, ist dies auch in diesem Fall die Referenztrajektorie dieses 


linear-quadratischen Optimierungsproblems. 


Beweis von Lemma 3.2: 
Aus B; = B? =: Bund Ry = R22 =: R ergeben sich durch die Zeitdiskretisierung mit (3.26) 


und der Darstellung der Gütemaße bzw. des Systemzustands über dem Optimierungshorizont 
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gemäß (3.24) bzw. (3.28) auch Hy = Hy =: Hund Ru = Roo =: R. Somit verandert sich 
Gleichung (3.31) zu 


OAR WOH 
HOH ROHR 


u 
l =0. (3.44) 


u H'Q2(®xo - X2) 


HTO: (@xo - >) 


Der optimale Stellgrößenverlauf der jeweiligen Spieler muss also dieses Gleichungssystem er- 
füllen. Um einen Ausdruck für die Summe der Stellgrößen der Spieler zu erhalten, werden die 
beiden Zeilen des Gleichungssystems (3.44) addiert. Nach Zusammenfassung der Terme ergibt 


sich 
(46, + HOH + RG, + i) + AT (Sıöxo - ž1) + Oba = %)) Eh; (3.45) 


Löst man diese Gleichung nach uj + u, auf und verwendet die Substitution Ò = Q: + Q> erhält 


man: 
ü; iy =- ATOA +R (RTG (w -07 Gii +GR)) 640 


Dies entspricht exakt der Lösung eines einzelnen Spielers mit den Gütemaßmatrizen Q und Ř 
sowie der Referenztrajektorie Qo (O1x1 + Oox2). Letztere wird bei einem identischen Referenz- 
verlauf fiir beide Spieler mit Xı = X =: X ebenfalls zu X. Weiterhin folgt für die Bestandteile 
der Matrix Q unmittelbar S = S1 + S2, Q = Q1 + Q2. 


Mit diesen Erkenntnissen lassen sich Rückschlüsse darüber ziehen, wie die Transition gestaltet 
werden muss, um die in [FHH*12] beschriebenen Risiken eines Uberschusses bzw. Defizits an 
Kontrolle vermeiden zu können. Hierfür muss zunächst mathematisch definiert werden, wie 
ein einzelner Spieler die Aufgabe löst, um einen Maßstab für eine idealen Transition nach 
Definition 3.5 zu erhalten. Die Stellgrößen sollen im Falle der alleinigen Aufgabenerfüllung 


durch Minimierung des folgenden Gütemaßes beschrieben werden können: 
T 
1 1 
J = „ar - Xr) S’xr - Xr) + 3 fe - X)  Q*(x - X) + u' Ru dt (3.47) 
0 


Für die nachfolgenden Erläuterungen wird der Fall betrachtet, dass die Aufgabe vollständig 
von Spieler 1 an Spieler 2 übertragen werden soll. Die Transitionen in die entgegengesetzte 
Richtung erfolgen analog. Zu Beginn der Transition beteiligt sich der übernehmende Spieler 
nicht an der Aufgabe. Gemäß der Gleichungen (3.33) und (3.34) muss also 


0,=0 (3.48) 
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und 


un 
N 
Il 

© 


(3.49) 


erfüllt sein. Damit der abgebende Spieler die Aufgabe zu Beginn der Transition optimal nach 


Gleichung (3.47) erfüllt, muss sein Gütemaß diesem entsprechen und somit 


Qı =Q*, (3.50) 
Sı =S (3.51) 

und 
%, =x (3.52) 


gelten. Am Ende der Transition sollen die Rollen vertauscht sein, d.h. die Matrizen Q; und Sı 
sind null und Spieler 2 handelt nach dem Gütemaß (3.47). 


Aus Lemma 3.1 bzw. Lemma 3.2 kann nun abgeleitet werden, wie die Transition verlaufen 
muss, damit sie auch während des Übergabeprozesses ideal bleibt. Für die Gütemaße der Spie- 


ler muss während des gesamten Prozesses gelten: 


Qi + Q2 = Q* (3.53) 
Sı + S2 =S (3.54) 
Xj =% =x (3.55) 


Mit der zusätzlichen Annahme, dass sich im Ubergabeprozess die Gewichtungen aller Zustän- 
de im selben Maße ändern, können die Gewichtungsmatrizen der Spieler Q; in einen zeitva- 
rianten Transitionsparameter «;(t) und die Matrix Q*, welche die Gewichtung bei alleiniger 


Ausführung der Aufgabe angibt, zerlegt werden: 
Q; = a;(t)Q" (3.56) 


Mit der Wahl des Transitionsparameters «;(t) im Intervall [0, 1] können alle Beteiligungsgra- 
de des entsprechenden Partners zwischen „keiner Beteiligung“ (æ; = 0) und dem Verhalten 
bei „alleiniger Aufgabenerfüllung“ (a; = 1) modelliert werden. Um für diese Darstellung die 


Bedingung einer idealen Transition zu erfüllen, muss 
a =1- a (3.57) 


gelten, d.h. die Übergabeparameter müssen konträr zueinander verlaufen. Es sei explizit dar- 


auf hingewiesen, das kein linearer Zusammenhang zwischen dem Transitionsparameter æi 
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und der resultierenden optimalen Stellgröße u}; besteht, also das Verhältnis von aı zu a2 im 


Allgemeinen nicht das Verhältnis von u] zu u% widerspiegelt. 


Fasst man alle gewonnen Erkenntnisse zusammen und wendet sie auf die Modellierung einer 
Haptic Shared Control Interaktion mit einem Differentialspiel an, so ergibt sich die nachfol- 


gende Definition: 


Definition 3.6 (Ideale Transition für ein Zweispieler LQ-Differentialspiel in ei- 


nem Haptic Shared Control Szenario) 


Aus den Anforderungen für eine ideale Transitionen gemäß Definition 3.5 in einem Haptic 
Shared Control Szenario ergibt sich ein Spezialfall des Zweispieler LO-Differentialspiels mit 


Zustandsreferenzen aus Definition 3.4 mit den Gütemaßen 


T 


1 1 
h= 5 XT - Xr) a, 7S" (xr -Xr)+ 3 fe - X) a@Q"(x -X)+ ulRuydt (3.582) 
0 
T 


pE ‚er ee 5 I (x- 3)" Q'(K-x)+uJRugd?, (358b) 
0 
der Systemgleichung 
x = Ax + Bu, + Bug (3.58c) 
und dem Startzustand 
x(0) = xo. (3.58d) 


Die Transitionsparameter «;(t) € [0,1] geben die Beteiligung der Spieler an der Aufgabe an. 
Damit die Transitionen ideal gemäß Definition 3.5 erfolgen, muss Vt € [0, T] stets gelten: 


@=1-% (3.58e) 


Die Lösung dieses speziellen Spiels erfolgt analog mit den Verfahren aus Abschnitt 3.2.1 bzw. 
Abschnitt 3.2.2. Die Modellparameter Q*,S* und R lassen sich mit diversen Verfahren aus den 
Steuer- und Zustandsgrößentrajektorien bei manueller Durchführung ermitteln und die Au- 
tomation entsprechend auslegen [HSB12, JAB13, LK12, PCC* 15]. Der Verlauf der Transitions- 
parameter lässt sich hingegen frei vorgeben und damit auch der Verlauf der Übergabe bestim- 
men. So kann sowohl die Dauer als auch die Form der Transitionsphase festgelegt werden 


und situationsspezifische Faktoren, wie die verbleibende Fähigkeit der Automation oder die 
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Kritikalität der Situation, für die Auswahl des Verlaufs berücksichtigt werden. Weiterhin kann 
die Reaktion des Menschen sensorisch erfasst und beispielsweise durch eine dazu passende 
schrittweise Übergabe sichergestellt werden, dass der menschliche Partner in der Lage ist, auf 
die vorgegebene Transition adäquat zu reagieren. Im Rahmen der Abschlussarbeit [Got16] 
wurden verschiedene Übergabeverläufe umgesetzt und miteinander verglichen. Nachfolgend 
soll anhand eines Beispielsystems die Umsetzung von Übergaben mit Hilfe der Modellierung 


mit einem zeitvarianten Differentialspiel gemäß Definition 3.6 gezeigt werden. 


3.4 Simulation der Transitionen zwischen zwei Partnern 


an einem Beispielsystem 


Die in diesem Abschnitt durchgeführte Simulation veranschaulicht, wie mit der Methode aus 
Abschnitt 3.3 Übergaben modelliert werden können. Dazu werden zunächst das simulierte 


Szenario und anschließend die Ergebnisse gezeigt. 


Simulationsszenario 


Als Aufgabenstellung liegt die Positionierung einer Masse m vor, welche mit einer Feder mit 
Federkonstante c und einem Dämpfer mit Dämpfungskonstante d gelagert ist. Das System ist 
in Abbildung 3.2 dargestellt. 


Abbildung 3.2: Prinzipskizze des simulierten Feder-Masse-Dämpfer-Systems 


Die beiden Akteure beeinflussen die Position x und die Geschwindigkeit v der Masse, indem sie 


eine Kraft Fı bzw. F, auf die Masse ausüben. Hieraus ergibt sich folgende Systemgleichung: 


H- ali 


Das Ziel jedes Spielers besteht darin, jeweils die Stellgröße zu finden, welche einen Kompro- 


0 
1 
m 


AR+\,|R (3.59) 


m 


miss aus geringem Abstand zur Zielposition x, gewichtet mit qx, bei gleichzeitig möglichst 
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Zeit in s 


Abbildung 3.3: Transitionsparameterverlauf von Spieler 1 (durchgezogene Linie) und Spieler 2 (gestrichelte Linie) 
fiir das Simulationsszenario 


niedriger Geschwindigkeit und niedrigem Kraftaufwand, gewichtet mit q, bzw. r, darstellt. 
Zusammen mit dem individuellen Transitionsparameter a; kann das Gütemaß eines Spielers 


zur Beschreibung dieses Ziels wie folgt formuliert werden: 


= 
1 |xr - Xr qx Of} [xr - XT 
Ji=3 Oi,T 
2 UT 0 qu UT 
T Alc 
1 x-X 0||x-x 
+ Ji Qi I + rF? dt (3.60) 
2 Vv 0 qu Vv 
0 


Für das simulierte Szenario werden drei Transitionen vorgegeben, d.h. die alleinige Durchfüh- 
rung der Aufgabe wechselt drei mal zwischen den beiden Partnern. Die Referenzposition liegt 
zu Beginn des Szenarios bei X = 1m und Spieler 1 beginnt mit der Lösung der Aufgabe ausge- 
hend vom Startzustand [x, vo]! = [0m, Om/s]'. Es folgen zwei Transitionen, wodurch die 
Kontrolle zunächst an Spieler 2 und anschließend wieder zurück an Spieler 1 übergeben wird. 
Die Transitionen unterscheiden sich jedoch in ihrer Form. Bei der ersten Transition gilt die 
Bedingung (3.57) und der Transitionsparameter @ von Spieler 1 fällt im gleichen Maße, wie 
der Transitionsparameter a, von Spieler 2 ansteigt. Dies ist bei der zweiten Übergabe nicht 
durchgehend der Fall. Stattdessen wurde eine Phase eingefügt, in der a auf 0,2 absinkt, a je- 
doch nur auf 0,3 ansteigt. Hierdurch wird die Anforderung für eine ideale Transition zeitweise 
verletzt. Vor der dritten Übergabe ändert sich die die Sollposition X auf 0 m. Der Verlauf der 
Transitionsparameter ist ansonsten identisch zur ersten Übergabe und die Anforderung wie- 
der im gesamten Verlauf erfüllt. Abbildung 3.3 zeigt den Transitionsparameterverlauf beider 
Spieler für das gesamte Simulationsszenario. Die übrigen Parameter wurden gemäß Tabelle 
3.1 gewählt. 


In der praktischen Anwendung ist die Solltrajektorie üblicherweise abhängig von der aktuellen 
Situation und nur für einen begrenzten Zeitraum vorhersehbar. Dies wird auch in der Simula- 


tion berücksichtigt und ein Prädiktionshorizont der Länge 1s gewählt. Es wird angenommen, 
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Parameter Wert Einheit 


m 0,05 kg 
d 0,25 kg/s 
c 1 kg/s? 
qx 3 1/m? 
qv 0,1 s?/m? 
r 1 1/N? 


Tabelle 3.1: Werte der System- und Gütemaßparameter für die Simulation 


dass sowohl der Verlauf der Solltrajektorie als auch die Verläufe der Transitionsparameter in 
diesem Zeitraum exakt vorhergesagt werden können. Analog zur modellbasierten Pradiktivre- 
gelung erfolgt die Lösung des Optimierungsproblems iterativ über einen gleitenden Horizont. 
Das bedeutet, dass das Optimierungsproblem zunächst ausgehend vom aktuellen Zustand für 
einen Zeitraum entsprechend dem Prädiktionshorizont gelöst und diese Lösung für einen Ab- 
tastschritt verwendet wird. Anschließend werden die prädizierten Werte und der momentane 
Zustand aktualisiert und die Lösung für den nächsten Abtastschritt bestimmt [BBM17]. Diese 
Kombination aus Update der Werte und Berechnung des nächsten optimalen Schritts wird bis 
zum Ende der Simulation wiederholt. Für die Nutzung in der Praxis besitzt der iterative Ansatz 
gegenüber einer optimalen Steuerung den weiteren Vorteil, dass Fehler im Modell durch die 
stetige Aktualisierung des Zustands sofort korrigiert werden und sich nicht über den gesamten 


Zeitraum aufsummieren. 


Die Simulation erfolgte mit einer Abtastzeit von 20 ms in MATLAB/Simulink R2016a auf einem 
aktuellen Computersystem (Intel Core i7-6600U; 2,81 GHz; 12 GB RAM). Das resultierende 
Differentialspiel wurde sowohl mit Hamilton- als auch mit dem Batch-Ansatz gelöst, wobei die 
Diskretisierung des Systems bzw. die numerische Lösung der Differentialgleichung mit dem 


Euler-Verfahren ebenfalls mit einer Diskretisierungszeit von 20 ms durchgeführt wurden. 


Simulationsergebnisse 


Die aus dem Simulationsszenario resultierenden Stell- und Zustandsgrößentrajektorien sindin 
Abbildung 3.4 dargestellt. Die Verläufe zeigen, dass die Unterschiede in der Lösung durch die 
unterschiedliche Reihenfolge von Diskretisierung und Optimierung bei Hamilton- und Batch- 
Ansatz gering sind. Die Verfahren heben sich jedoch in der benötigten Zeit pro Berechnung 
einer Lösung für den Prädiktionshorizont von 1s voneinander ab. Auf dem gegebenen System 
ist die Berechnung der optimalen Stellgröße für diesen Zeitraum mit dem Hamilton-Ansatz 


nach 0,36 ms abgeschlossen, während der Batch-Ansatz hierfür 2,08 ms benötigt. 
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(b) Verlauf der Position (durchgezogene Linie) und der Referenzposition (gestrichelte Linie) 


v in m/s 
fæ} © 
P 

| 


Zeitins 
(c) Verlauf der Geschwindigkeit 


Abbildung 3.4: Simulation des Beispielszenarios unter Verwendung des Hamilton- (rot) und des Batch-Ansatzes 
(blau) 


Da die Ergebnisse jedoch qualitativ identisch sind, wird die nachfolgende Beschreibung der 
resultierenden Übergaben nicht in die Lösungsverfahren unterteilt. Ausgehend vom Startzu- 
stand stellt Spieler 1 zunächst die optimale Stell- und Zustandsgrößenkombination für die 
alleinige Lösung der Aufgabe ein. Im Beispielsystem stellt sich für die konstante Kraft F der 
stationäre Zustand x = a und v = 0 m/s ein. Da bei den gegebenen Parametern der quadra- 
tische Abstand zur Zielposition X = 1m via qx dreimal so stark bestraft wird wie das mit r 
bestrafte Quadrat der aufgebrachten Kraft, ergibt sich die Position x = 0,75 m durch eine Kraft 
F, = 0,75N als optimaler Kompromiss. Diese Kraft muss folglich auch während der Transi- 


tion von den beiden Kooperationspartnern zusammen aufgebracht werden, damit das System 
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den optimalen Zustand beibehält und die Transition als ideal gemäß Definition 3.5 bezeichnet 


werden kann. 


Die Übergabe der Aufgabe an Spieler 2 beginnt, sobald die Veränderung der beiden Transi- 
tionsparameter a und a2 im Prädiktionshorizont sichtbar ist, hier also bei t = 1 s. Da während 
dieser ersten Übergabe die Bedingung (3.57) durch den konträren Verlauf von a und az erfüllt 
ist, bleibt die Summe der aufgebrachten Kräfte beider Spieler konstant. Folglich bleibt auch das 
System während der gesamten Übergabe im gleichen Zustand und die Übergabe ist anhand der 
Systemzustände x und v nicht zu erkennen. Die entstehende Transition ist dementsprechend 


ideal. 


Bei der zweiten Übergabe wird die Bedingung verletzt und Spieler 1 nimmt die Aufgabe nicht 
im gleichen Maße an, wie Spieler 2 sie abgibt. Durch die Multiplikation der Positionsgewich- 
tung qx mit 0,2 bzw. 0,3 ist die kombinierte Gewichtung nur noch 1,5 mal so groß wie die 
Gewichtung des Stellaufwands, wodurch sich der Zustand x = 0,6m und v = O m/s als neuer 
optimaler Kompromiss ergibt und sich die Trajektorienfolgequalität somit verschlechtert. Erst 
ab t = 7,8s, wenn wieder über den gesamten Prädiktionshorizont die Bedingung (3.57) gilt, 


wird dieselbe Abweichung zur Referenz wie zuvor erreicht. 


Vor der dritten Übergabe ändert sich die Zielposition auf x = 0m. Da der Zustand x = 0m 
und v = 0m/s eine Ruhelage des Systems ist, können die Spieler mit F; = 0 der Referenz exakt 
folgen. Da in diesem Fall jeder nicht-negative Wert von a; zu F; = 0 führt, können dann anhand 


der Stellgröße keine Rückschlüsse auf die Übergabeparameter der Spieler gezogen werden. 


Die Simulation verdeutlicht, dass es mit der Modellierung über zeitvariante Differentialspie- 
le möglich ist, Übergabeprozesse zwischen zwei Akteuren darzustellen. Die in Abhängigkeit 
der Transitionsparameter berechneten optimalen Stellgrößen sind für die beiden vorgestell- 
ten Lösungsverfahren nahezu identisch, unterscheiden sich jedoch in der Berechnungszeit. 
Über den Verlauf der Transitionsparameter können verschiedenste Übergabevorgänge reali- 
siert werden. Soll die Erfüllung der Aufgabe während dieses Prozesses unabhängig von der 


Referenzposition gleich bleiben, müssen die Transitionsparameter konträr verlaufen. 


Zusammengefasst wurde in diesem Kapitel das spieltheoretische Konzept der Differentialspiele 
und deren Lösung vorgestellt. Es wurde gezeigt, wie durch Verwendung zeitvarianter Gütema- 
ße dieses Konzept zur Modellierung von Mensch-Maschine-Interaktion mit wechselnder Auf- 
gabenverteilung verwendet werden kann. Über die Vorgabe der Transitionsparameter kann 
die Form und Dauer der Übergabe frei gestaltet werden. Dies gestattet eine Wahl des Transi- 
tionsverlaufs, die es dem übernehmenden Partner erlaubt, sich an die Situation anzupassen. 


Eine Alternative zur Vorgabe des Transitionsverlaufs wird im nächsten Kapitel präsentiert. 


4 Adaption des Transitionsparameters an die 
Aktion des Menschen 


In dem vorangegangenen Kapitel wurde eine Modellierung der Ubergabeprozesse zwischen 
Mensch und Maschine vorgestellt und der Verlauf der Transition vorgegeben. Dabei ist es 
fiir die Anwendung notwendig, dass die Vorgabe in einer Art und Weise erfolgt, die es dem 
Menschen erlaubt sein eigenes mentales Modell an diese Vorgabe zu adaptieren. Alternativ 
dazu können diese Rollen auch vertauscht und die Automation so gestaltet werden, dass sie 
sich an die Involviertheit des Menschen anpasst. Dafür wird ein neues Verfahren benötigt, um 
zur Laufzeit den Transitionsparameter zu schätzen, der die Aktion des Menschen erklärt. Mit 
dieser Schätzung kann das Modell der Automation aktualisiert und die menschliche Aktion 
so ergänzt werden, dass immer eine ideale Transition entsteht. Die Vorstellung des hierfür 
entwickelten Adaptionsverfahrens ist Gegenstand dieses Kapitels. Dazu wird zunächst in Ab- 
schnitt 4.1 das Schätzproblem formuliert. Zur Lösung dieses Problems wird in Abschnitt 4.2 
jeweils ein Verfahren hergeleitet, welches auf dem Hamilton- bzw. dem Batch-Ansatz basiert. 
Ein Vergleich der beiden Verfahren in der Simulation in Abschnitt 4.3 bildet den Abschluss des 
Kapitels. 


4.1 Formulierung des Schätzproblems 


Das Ziel des Adaptionsverfahrens lautet, den Transitionsparameter der Automation stets so 
zu wählen, dass eine ideale Transition gemäß Definition 3.5 zwischen den Partnern abläuft. 
Entsprechend der Modellierung nach Definition 3.6 wird Spieler 1 im Folgenden als der Part- 
ner betrachtet, dessen Transitionsverlauf unbekannt ist und mit æ modelliert wird. Der zweite 
Partner verwendet das Ergebnis der Schätzung, um dann durch den konträren Transitionsver- 


lauf 1 - a gemäß Bedingung (3.57) die ideale Transition sicherzustellen. 


Die bereits in Abschnitt 2.4 vorgestellten Adaptionsverfahren [SCJ08, LTC* 15] verwenden den 
Sonderfall von Differentialspielen mit einem unendlichen Horizont und lassen sich deshalb 
nicht auf die Modellierung aus Abschnitt 3.3 anwenden. Dennoch wird auch für das hier vor- 
gestellte Verfahren die Idee aufgegriffen, den Fehler e zwischen der zum aktuellen Zeitpunkt 
to gemessenen Stellgröße u1, und der für diesen Zeitpunkt prädizierten Stellgröße uj y des 


Kooperationspartners zu nutzen. Basierend auf diesem Fehler wird das Modell adaptiert und 
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darauf aufbauend der Transitionsparameter der Automation erganzt. Die Grundlage fiir dieses 
neue Adaptionsverfahren wurde im Rahmen der Masterarbeit [Geb18] geschaffen. Abbildung 
4.1 zeigt die um die Adaption erweiterte Regelungsstruktur. 


x 
ADAPTION © SYSTEM 


AUTOMATION 


löst Differentialspiel mit 


aktuellem Transitionsparameter 


Abbildung 4.1: Erweiterung der Regelungsstruktur um eine Adaption zur Ermittlung des aktuellen Transitionspara- 
meters des Menschen 


Für die Adaption wird die folgende quadratische Fehlerfunktion gewählt: 


Bla) = Zela)Tela) = „u = Uno) (4.1) 


Der Wert von uj ,, hängt vom Verlauf von a über dem gesamten Prädiktionshorizont ab. Das 
bedeutet, es gibt unendlich viele Verläufe von «, die zu einem solchen Un führen können. Die 
Schätzung von a soll jedoch bereits ebenfalls zum Zeitpunkt to auf Basis der aktuellen Mes- 
sung U1,ņ erfolgen, da der aktuelle Zustand der Transition direkt für die Automation genutzt 
werden soll. Aus diesem Grund wird für das Schätzverfahren die Annahme getroffen, dass sich 
a über dem Prädiktionshorizont nicht verändert und so durch eine Konstante statt durch eine 
Trajektorie beschrieben werden kann. Da die Berechnungen in der Praxis jedoch iterativ über 
einen gleitenden Horizont erfolgen (vgl. Abschnitt 3.4), wird die Schätzung trotzdem nach 
jedem Optimierungsschritt aktualisiert. Durch die ständige Aktualisierung erhält man einen 


zeitvarianten Gesamtverlauf von a aus der Aneinanderreihung der geschätzten Konstanten. 
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Die Aufgabe des Adaptionsalgorithmus lautet, den aktuellen Transitionsparameter so anzu- 


passen, dass dieser die Fehlerfunktion (4.1) minimiert: 
a = arg min E(a) (4.2) 


Anders formuliert soll der konstante Transitionsparameter ermittelt werden, fiir den die op- 
timale Stellgröße des Modells zum Zeitpunkt tọ mit der tatsächlich applizierten Stellgröße 
übereinstimmt. Das hierfür verwendete Lösungsverfahren wird im nächsten Abschnitt vorge- 
stellt. 


4.2 Verfahren zur Schätzung des aktuellen 
Übergabezustands basierend auf der menschlichen 
Aktion 


Zur Lösung des in Gleichung (4.2) beschriebenen Optimierungsproblems wird ein gradien- 
tenbasiertes Verfahren eingesetzt. In gradientenbasierten Verfahren wird die Lösung iterativ 
berechnet, indem der aktuelle Wert durch einen Schritt der Länge s entlang der, mit Hilfe des 


Gradienten berechneten, Optimierungsrichtung p verbessert wird: 
a™D -a tsp (4.3) 


Um eine Schrittweitensteuerung zu vermeiden, die weitere zeitaufwendige Berechnungen von 
Lösungen des Differentialspiels benötigten würde, wird ein Newton-Verfahren zur Lösung des 
Optimierungsproblems (4.2) gewählt. In diesem wird die Schrittweite inhärent mitbestimmt 
und s kann zu 1 gewählt werden [NW06, S.46]. Mit der Optimierungsrichtung p gemäß [NW06, 
S.44] lautet die Update-Vorschrift des Newton-Verfahrens dann: 


aD = g E” (aY 1E (a) (4.4) 


Für die Berechnung des Optimums werden also sowohl die erste Ableitung E’ als auch die 
zweite Ableitung E” der Fehlerfunktion nach a benötigt. Die entsprechenden Berechnungs- 


vorschriften bei Verwendung einer Fehlerfunktion gemäß (4.1) ergeben sich zu 


E’(a) = e (a) ela) 


a 
= a, - uito) (45) 
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und 


E” (a) = e(a) e (a) + e” (a) ela) 


_ ( duj(a)\' / daila) deila) : 
-(- ia ) (- a )- (da)? (u; - u;(@)). (4.6) 


Die Anpassung des Transitionsparameters mit Hilfe der Gleichung (4.4) erfordert somit die 
Berechnung von uj, sowie deren erste und zweite Ableitung nach «. Da die Berechnungsformel 
von u} davon abhängt, ob der Hamilton- oder der Batch-Ansatz verwendet wird, werden die 


weiteren Schritte in den nachfolgenden Unterkapiteln getrennt dargestellt. 


4.2.1 Berechnung des Schätzwerts basierend auf dem 
Hamilton-Ansatz 


Unter Verwendung der Lösung aus dem Hamilton-Ansatz nach Gleichung (3.22) zur Lösung 
des Zweispieler LQ-Differentialspiels bei idealer Transition nach Definition 3.6 ergibt sich die 


erste Ableitung der Stellgröße des ersten Spielers nach a zu 


4. 
da da en) 


Die Ableitung a lässt sich jedoch nicht unmittelbar berechnen, da die Funktion P; (a) nicht 


explizit vorliegt, sondern nur implizit über das Differentialgleichungssystem 


Pi =- A'P, - PıÄ + PTP; + Py TP; - aQ“ (4.8a) 


P, = - A'Py - PÅ + PTP} + P2TP; - (1 - a)Q" (4.8b) 


mit den Endwerten 


Pı(T) =a7S" (4.8c) 
P2(T) =(1 - ar)S” (4.8d) 


gegeben ist (vgl. Gleichung (3.21)). Das in den Gleichungen (4.8a) und (4.8b) enthaltene Symbol 
T wird in diesem Abschnitt durchgängig als Kurzform für den Ausdruck BR™!B' verwendet. 


Um die gesuchte Ableitung zu berechnen, hilft der Satz über implizite Funktionen weiter. Der 


Satz stellt Bedingungen auf, unter denen eine Operatorgleichung 


F(u,v)=0 (4.9) 
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in der Umgebung eines Punktes (uo, vo), für den die Gleichung (4.9) erfüllt ist, d.h. 
F(w, vo) = 0 (4.10) 


gilt, implizit eine Funktion v = f(u) beschreibt. Nach [Zei91, S.250 f.] lautet der Satz: 


Satz 4.1 (Satz über implizite Funktionen) 


Seien X, Y und Z Banachräume überK, und sei 
F : U(u, vo) E XxY OZ 


eine C"-Abbildung in einer offenen Umgebung des Punktes (uo, vo), sodass (4.10) erfüllt ist 


und 1 < n < oo. Unter der Voraussetzung, dass der Operator 
Fılw, w):Y—>Z 


bijektiv ist, gilt: 


1. Es existieren Zahlen r > 0 und p > 0, sodass für jedes gegebene u € U mit U := {u € 
X : |u- uo|| < p} die Gleichung (4.9) eine eindeutige Lösung v € Y mit |v - vol < r 


hat. Diese Lösung wird mit v(u) bezeichnet. 


2. Die Funktion u > v(u) ist in U vom Typ C”. Insbesondere gilt 


v (u) = -Fy(u, v(u)) TFu(lv, v(u)) vue U. (4.11) 


Für den vollständigen Beweis des Satzes sei auf [Zei91, S.251 ff.] verwiesen. Hier soll kurz auf 
die Gleichung (4.11) eingegangen werden, welche für das Adaptionsverfahren von besonderer 


Bedeutung ist. Wenn nach dem Satz 4.1 eine Funktion v(u) existiert, gilt: 
F(u, v(u)) = 0 (4.12) 
Die Differentiation dieses Operators nach u unter Anwendung der Kettenregel ergibt 
F,,(u, v(u)) + Fy(u, v(u))ov’(u) = 0, (4.13) 


was wiederum mit Hilfe des inversen Operators von F,(u, v(u)) die Berechnung von v’(u) 
gemäß (4.11) erlaubt. Damit ist es möglich, die Ableitung einer Funktion zu berechnen, ohne 


diese explizit zu kennen. 
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Bevor der Satz über implizite Funktionen nun zur Berechnung von a) angewendet wer- 
den kann, muss zunächst noch die hierfür notwendige Frechet-Ableitung erläutert werden. 
Die Frechet-Ableitung stellt eine Erweiterung der Differentialrechnung auf normierte Räume 
dar. Sie wird über den linearen Anteil einer Zerlegung der Differenz zwischen zwei, sich um 
den infinitesimal kleinen Wert h unterscheidenden, Operatoren beschrieben. Formal ist die 


Fréchet-Ableitung nach [Zei91, S.228 f.] definiert zu: 


Definition 4.1 (Erste und zweite Fréchet-Ableitung) 


Seif : Uc X — Y ein gegebener Operator, der auf einer offenen Umgebung des Punktes 
u € U definiert ist, wobei X und Y Banachräume über K sind. 


1. Das Differential dF(u) von F am Punkt u existiert, falls es einen linearen beschränkten 


Operator der Form 
dF(u): X — Y 
gibt, sodass 
F(u+h)- F(u) = dF(u)[h] + o(Al), h — 0, (4.14) 


für alle h € X in einer offenen Umgebung von h = 0 in X erfüllt ist. 


Das Differential dF (u) wird erste Fréchet-Ableitung F’ (u) genannt. Weiterhin bezeich- 
net dF(u)[h] = F’(u)[h] den Wert der ersten Fréchet-Ableitung des Operators F an 
der Stelle u in Richtung von h. 


2. Das zweite Differential d’F(u) von F am Punkt u existiert, falls es einen bilinearen 


beschränkten Operator der Form 
dF(u) : XxX 3 Y 


gibt, sodass 


dF(u + k)[A] - dF(u)[h] = 2F(u)[k, h] + r (4.15) 
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für alle h € X und alle k in einer offenen Umgebung von k = 0 in X erfüllt ist und für 
das Restglied r 


in |r(u; k, h)| = o(fkl), k —> 0, (4.16) 
<1 


gilt. Analog zur ersten Ableitung wird d*F(u) als zweite Frechet-Ableitung F” (u) 
bezeichnet. 


Die Fréchet-Ableitung F’ (u) stellt eine Linearisierung des Operators F an dem Punkt u dar. 
Eine weitere Linearisierung von F’(u)[h] an dem Punkt u führt zu dem bilinearen Operator 


F” (u)[k, h]. 


Die Fréchet-Ableitung wird eindeutig durch (4.14) bestimmt und kann, vorausgesetzt sie exis- 
tiert, durch 


d 
F’(u)[h] = lim e )[F(u + eh) - F(u)] = —F(u + eh) (4.17) 

é—0 de e=0 
berechnet werden. 
Analog dazu impliziert die Existenz von F” (u) 

„ d / 
F” (w[k,h] = —F (u + ek)[h] (4.18) 
de e=0 


Darüber hinaus lassen sich mit den Gleichungen (4.17) und (4.18) im Fall von Operatoren mit 
mehreren Argumenten auch partielle Ableitungen F,,(u1, uz, ...) berechnen, indem die Ver- 
schiebung h nur im Argument u; berücksichtigt wird. Zur Verdeutlichung wird in dieser Ar- 
beit das entsprechende Argument als Index der Verschiebung angegeben, also beispielsweise 


hy, bei einer partiellen Ableitung nach uı. 


Mit Hilfe dieses erweiterten Konzepts der Ableitung und dem Satz über implizite Funktionen 
lässt sich nun die gesuchte Ableitung ermitteln. Dazu wird zunächst der folgende Operator 
definiert: 
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Definition 4.2 (Operator G) 
Es sei der Operator G eine Abbildung der Form 


G : U(æœ, (P10, P20) © Xx YZ 
mit 
X = [0,1], Y =(C (0, 77x [6,2 Pr Ze TIP? x (C10, Te". 


Der Operator sei in einer offenen Umgebung des Punktes (co, (P10, P2,0)) mit a € X und 
(Pio, P20) € Y definiert durch 


Pi + A'P, + PıÄ - f(Pı,P2) + aQ" 


Ka, (Pı,P2)) : = P, + A'P, + PLA - g(P1, P2) + (1 - a)Q* 


(4.19) 
mit 

f(Pı, P2) := PıTP> + PTP}, 

g(Pı, P2) ‘= PTP; + P2TP». 


Weiterhin sei G im Sinne der Fréchet-Ableitung differenzierbar und der Operator der partiel- 
len Frechet-Ableitung nach (P1, P2) 


96 


CP ,P2) = A(P1, P2) (4.20) 


im Punkt (co, (P1,0, P2,0)) bijektiv. 


Der Operator enthalt die gekoppelten Riccati-Differentialgleichungen (4.8) in der Art, dass die 


Lösung der Gleichungen bei gegebenem a die Operatorgleichung 
G(a, (P1, P2)) = 0 (4.21) 


erfüllt. Der Satz über impliziten Funktionen 4.1 sagt nun aus, dass innerhalb einer offenen 
Umgebung V c X von œ und einer offenen Umgebung W c Y von (Pi, P20) eine stetig 
differenzierbare Abbildung G: V — W mit (P1, P2) = G(qa) existiert, welche für alle a € V 
die folgende Gleichung erfüllt: 


Ga, G(a)) = 0 (4.22) 
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Berechnung von d, 


Die zur Berechnung von Gleichung (4.7) benötigte Ableitung von P; nach a ist ein Bestandteil 


der ersten Ableitung dieser implizit gegebenen Funktion G(e): 


dP 
G’(a) u Pig s ra 
Poe de 


Die Ableitung G’ (æ) kann gemäß (4.11) wiederum durch Differenzieren der Operatorgleichung 
(4.21) mit Hilfe der Fréchet-Ableitung (4.14) unter Anwendung der mehrdimensionalen Ket- 
tenregel analog zu Gleichung (4.13) ermittelt werden: 


Gala, G(a))[ha] + Ge, p,)(a, G(a))[G"(a)[ha] = 0 (4.23) 


für alle hg € X. 


Aus dieser Gleichung ergibt sich folgendes Differentialgleichungssystem zur Berechnung der 
Komponenten von G’(a): 


Lemma 4.1 (Gekoppeltes Differentialgleichungssystem zur Berechnung von Pig 
und P;.) 


Die Ableitungen Pq und P2q lassen sich durch Lösen des gekoppelten Differentialgleichungs- 
systems 


Pig = DıPıa + PıaC + PıTPaa - Q (4.24a) 
Pog = D2P2q + P2aC + P2TPig + QO” (4.24b) 


mit den Kurzschreibweisen 


C := T(Pı + P2)-A, (4.24c) 
D; :=P;T-Ä' (4.24d) 
und den Endwerten 
Pia(T) = Š (4.24e) 
Poa(T) = - Š (4.24f) 


bestimmen. 
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Beweis von Lemma 4.1: 

Zum Beweis des Lemmas werden zunächst die einzelnen Summanden von Gleichung (4.23) 
getrennt betrachtet. Der erste Summand erfordert die Bestimmung der partiellen Ableitung 
des Operators G nach dem Skalar a. Gemäß Gleichung (4.17) ergibt sich: 


Gala, G(a))[he] = lim e [Gla + cha, G(a)) - G(a, G(a))] (4.25) 
Alle Terme ohne a heben sich auf 
stim et {| re |_| eQ (4.26) 
é>0 (1 - a - chg)Q* (1 - a)Q* i 
‘ae = cha‘ 
= lim gl u (4.27) 
[0% 
= [hr 4.28 
er (4.28) 


Für den zweiten Summanden von Gleichung (4.23) muss der Operator G zunächst partiell nach 
(P1, P2) differenziert werden und der resultierende Operator anschließend auf G’(a)[h.] an- 
gewendet werden. Zur Berechnung von Gp, p,)(a, G(«)) erfolgt die Verschiebung dieses Mal 
im Argument (P4, P2) entsprechend 


Py + eHı 
G + eh, p,) := Py + eH” (4.29) 
Durch Anwendung der Fréchet-Ableitung gemäß Gleichung (4.17) ergibt sich: 
Gip, P,)(% G(a)) [hp p)] = lim eI Gla, Gla) + eha) - Ga, G(@)) ] (4.30) 
=% nn 


Alle Terme ohne P, bzw. P2 heben sich auf 
BR, LP, + eH1) + A' (Py + EHı) 

= lim € q “7 
e>0 ar(P2 + €H2) + A! (P2 + €H2) 
+(Pı + €H;)A - f((Pı + eHı), (P2 + ¢H2)) 
+(P2 + €H2)A - g((Pı + €H1), (P2 + €H2)) 


) (4.31) 


P; + ATP; +PıA - (Pi, P2) 
Ps + ATP, + P2A - g(P1, P2) 
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= lim ©! 
é—0 


-P,THyeé = P, THe = H,TPje = H,TP;e 
-P2TH;€ = P2TH2€ 5 H>TPıe = H>TP3e 


) (4.32) 


H, + (AT - PıT)Hı + Hı(A - T(Pı + P2)) - Py THe 
H, + (AT _ P,T)H3 + H(A = T(Pı + P,)) _ PTH; 


eH, + ATeHı + cH A 
eH + A’ cH + cH A 


-H,TH;, e? = H,TH 2? 
-H,TH, e? = H,TH3e? 


(4.33) 


Wendet man diesen Operator nun auf das Element G’(a)[hq] an, erhält man unter Nutzung 
der im Lemma genannten Kurzschreibweisen (4.24c) und (4.24d) für den zweiten Summanden 
aus Gleichung (4.23) 


Pigha - DıPıaha - PıahaC - PıTPaah 
Ger, P5)(& G(a))[G’(a)[ha]] =[# lalla 1t 1alta lalla 144 2alla (4.34) 
Poaha = D2P2aha u PoghaC = P2TPigha 
Pig - DıPıa - PıaC - PıTP 
Sie la 18 1a la 1 2a ha. (4.35) 
Pza - D2P2a - P2aC - P2TP1a 
Einsetzen der Summanden (4.28) und (4.35) in (4.23) ergibt das Gleichungssystem 
J Pig - DıPıa - PıaC - Pi TP 
Q q [Fra = DiPia = Pia 1TP2a| y= 0, (4.36) 
-Q Pza - D2P2a - P2aC - PoTPia 


welches für alle Werte von hg erfüllt sein muss. Hieraus ergibt sich unmittelbar das Differen- 
tialgleichungssystem des Lemmas bestehend aus den Gleichungen (4.24a) und (4.24b). Die zur 
Lösung erforderlichen Endwerte gemäß (4.24e) und (4.24f) erhält man durch Ableitung der 


Gleichungen (4.8c) und (4.8d) nach æ, wodurch der Beweis des Lemmas 4.1 vollständig ist. 


Die konkrete Berechnung der Lösung des Differentialgleichungssystems erfolgt erneut nume- 
risch. Gemäß Gleichung (4.7) wird nur Pj, für die Ableitung der Stellgröße u; nach a benötigt. 
Durch Einsetzen von Pj, in (4.7) lässt sich zunächst diese Ableitung und damit schließlich der 
Gradient der Fehlerfunktion E’(a) nach Gleichung (4.5) berechnen. P2q wird bei der Berech- 
nung der Lösung des Gleichungssystems ebenfalls bestimmt, aber für den Gradienten nicht 


2 


benötigt. Die Werte von P2q sind jedoch für die nachfolgende Berechnung von oe notwen- 


dig. 
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a dPı 
‘daz 


Berechnung von 
Für die Berechnung von E” (æ) nach (4.6) wird neben der ersten Ableitung von u; nach a auch 


du 
die zweite Ableitung £ a TG a) benötigt. Die erneute Ableitung von Gleichung (4.7) ergibt: 


d2uj(a) _ 1% nel Pi(a) - 
day? ” -R'B “dat * (4.37) 


2 
Um den Term an zu bestimmen, wird die Frechet-Ableitung ein weiteres Mal auf die bereits 


einmal differenzierte Operatorgleichung (4.23) angewendet und diese partiell nach a abgelei- 


tet. Mit Hilfe der mehrdimensionalen Kettenregel ergibt sich die Gleichung 


Gaala, Ga))[Ka; ha 
+Ga(p,,P,)(a GG [Ka], ha 
+OP, Paja(%, G(a)) [kas G’(a)[ha] 

+OP, P2)(P1,P2)(% G(@))[G’ (a) [ka], G'(@) [hal] 
ha] 


] 
] 
] 
] 
+Gp,,P,)(@, Sa))IC” (a) [kas hal] = 


(4.38) 


mit hy, ky € X, welche dann innerhalb von 


dp 

G! (a) = Praa| ._ (day? 
Pow Py 

(da)? 


die gesuchte Ableitung enthält. Die Komponenten von G” (æ) lassen sich mit Hilfe des folgen- 


den Lemmas berechnen: 


Lemma 4.2 (Gekoppeltes Differentialgleichungssystem zur Berechnung von Pigg 
und Pgo) 
Die Ableitungen Pigg und P2aq lassen sich durch Lösen des gekoppelten Differentialglei- 


chungssystems 


Pigg = PigaC + D1Piga + PıTPaga + 2PigT(Pia + Poa) (4.39a) 
Pa = PogaC + DoP2qq + P2TPıaa + 2P2aT(Pıa + P2a) (4.39b) 
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mit C und Di gemäß Gleichung (4.24c) bzw. (4.24d) und den Endwerten 


Piga(T) = 0 (4.39¢) 
Powa(T) = 0 (4.39d) 


bestimmen. 


Beweis von Lemma 4.2: 
Das Differentialgleichungssystem (4.39) folgt aus Gleichung (4.38). Es werden erneut zuerst 
die einzelnen Summanden dieser Gleichung bestimmt und anschließend gezeigt, dass deren 


Summe zu oben genanntem Lemma führt. 


Da Ga weder von a noch von dem Element (P1, P2) abhängt (vgl. Gleichung (4.28)), gilt für die 
ersten beiden Summanden 


Gaala, G(a))[ka, ha] = hl (4.40) 
und 
Cap, P2)(% G(a))[G"(a) [ka], ha] = ; ; (4.41) 


Auch fiir den dritten Summand gilt 


GP, P2)a(@ G(a))[ka, G(a) [hal] = 


0 
: (4.42) 


da Gp, p,)(@, G(@)) gemäß Gleichung (4.33) keine explizite Abhängigkeit von a besitzt. Somit 


verbleiben nur die letzten beiden Summanden, sodass sich (4.38) zu 


Gip, PaP, Pa) (4s C(@))LG’(a) kal, G(a)[hall + Gp, p,,(a, Ola)” (a)lkashall =0 (4.43) 
vereinfacht. 


Zur Berechnung von Gp, p,)(p;,P,)(@, G(@)) muss die partielle Fréchet-Ableitung bzgl. (P1, P2) 
zweimal auf G(a, G(«)) angewendet werden. Im Beweis von Lemma 4.1 wurde bereits der ein- 


mal abgeleitete Operator Gip, p,)(@, G(a))[h(p, p,)] benötigt, welcher in Gleichung (4.33) gege- 
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ben ist. Wendet man analog zu Gleichung (4.18) die partielle Frechet-Ableitung bzgl. (P1, P2) 


mit 


Py $ K1 


4.44 
P2 + eKa ( ) 


G + ekp,p,) `= 


auf diesen Operator an, ergibt sich: 


GP, P2)(P1.P2)(@; Gla) kp, p3)» he, p.)] 

= lim E [Cp p, (a, G(a) + ekp, Pa [hp Pa] - Or paa Che, p,y]] (4.45) 
Ne a ky 
Alle Terme ohne P4 bzw. P> heben sich auf 

li zf -(P; + éK,)TH, =; H,T(Pı + K1) iag Hı T(P; + éK2) = (Pı + eKı)TH3 
= Įm € 

é0 -(P2 + €K2)TH2 = H2T(P2 + eK) = H>T(Pı + K1) - (P2 + eK>)THı 
-P, TH, - H, TP; - Hı TP; - PıTH3 
-P>TH3 - H>TP> - HeTP2 - PTH; 


) (4.46) 
= lim ©"! ( 
é>0 


) (4.47) 
-K, TH; - Hı TK, - Hı TK; - Kı TH; (4.48) 
-K;TH; - H2TK2 - HTK; - KTH; i 


-Kı TH; zu eHı TK, = Hı TK: = E€Kı TH: 
-€K2TH2 — €H2TK2 = eH>TKi = éeKoTH, 


In Gleichung (4.43) wird dieser Operator in der Art verwendet, dass für das Argument kip, p,) 
der Wert G’(a)[kq] und für das Argument hp, p,) der Wert G’(a)[h«] genutzt wird. Für diesen 


Fall erhält man: 


GP, Pa Pi P2)(@% G(@))G(a) [ka], G’(@) [ha] 


-2PıaTPıa - 2Pıa TP2a 
—2P2qTP2a = 2P2qTPia 


kaha (4.49) 


Der letzte Term Gp, ‚p,)(@, G(a))[G”(a)[ka, ha]] beschreibt genau den in (4.33) bereits berech- 


neten Operator, diesmal jedoch angewendet auf G” (æ)[kg, ha] und ergibt sich somit zu 


Ge, p.)(a, G(a))[G”(a) ka, hal] 


Bite = Di Pica = PigaC 3 PıTP3aa 
Powe a D2P2qa = P3aaC ~ P2oTPi ge 


kaha, (4.50) 


wobei wieder die Kurzschreibweisen aus den Gleichungen (4.24c) und (4.24d) verwendet wer- 
den. Die Summe der beiden Terme (4.49) und (4.50) muss für alle kg und hg gleich Null sein, 
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d.h. Piga lässt sich als Teil der Lösung des in Lemma 4.2 beschriebenen Differentialgleichungs- 


systems bestehend aus (4.39a) und (4.39a) berechnen. Die zur Lösung notwendigen Endwerte 


ergeben sich unmittelbar durch Differentiation der Gleichungen (4.24e) und (4.24f) nach a. 


Mit diesem Differentialgleichungssystem steht nun eine Berechnungsvorschrift für Pigg zur 
Verfügung, welche zunächst in Gleichung (4.37) eingesetzt und deren Ergebnis dann zur Be- 


rechnung von E” (æ) nach Gleichung (4.6) verwendet werden kann. 


Folglich müssen für die Adaption mit dem Newton-Verfahren unter Anwendung der Lösung 
mit dem Hamilton-Ansatz neben dem Differentialgleichungssystem zur initialen Lösung des 
Differentialspiels (4.8) für jede der Ableitungen jeweils ein weiteres Differentialgleichungs- 
system entsprechend (4.24) bzw. (4.39) gelöst werden. Alternativ kann zur Schätzung des zur 
Aktion von Spieler 1 passenden Transitionsparameters auch der Batch-Ansatz verwendet wer- 


den. Die hierzu notwendigen Schritte zeigt der nächste Abschnitt. 


4.2.2 Berechnung des Schätzwerts basierend auf dem Batch-Ansatz 


Wird der Batch-Ansatz verwendet, um das Differentialspiel mit der Bedingung der idealen 


Transition (vgl. Definition 3.6) zu lösen, ergibt sich 


-1 


ai] [Eei iagi || en] asy 
u H'(1-@)QH H'(1-a)OH+R| |H'(1- a)Q(®xo - x) f 
mit 
[ro 0 0 | 
1) _ 0 ws, 
|: TQ” 0 
0 0 Se 


als Spezialfall von Gleichung (3.32). 


Es ist theoretisch möglich, diese Gleichung direkt nach œ umzustellen und so eine explizi- 
te Funktion des Transitionsparameters in Abhängigkeit der gemessenen Stellgröße des ersten 
Partners zu erhalten. Entsprechende Verfahren wurden in der Masterarbeit [Liu18] untersucht, 
mit dem Ergebnis, dass diese nur begrenzt in der Praxis einsetzbar sind, da die in den Ver- 
fahren notwendige Invertierung von schlecht konditionierten Matrizen numerische Probleme 
erzeugt. Stattdessen wird auch für diesen Lösungsansatz eine iterative Berechnung von a mit 


Hilfe des, zu Beginn des Abschnitts vorgestellten, Newton-Verfahrens empfohlen. 
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Die zur Berechnung von (4.5) bzw. (4.6) benötigte Stellgröße uj (æ) findet sich als erster Eintrag 
des Vektors u} wieder. Da durch die Diskretisierung ein expliziter Zusammenhang von uj 


und @ gegeben ist, lassen sich die erste und zweite Ableitung en bzw. Tat ) hier direkt, 
d.h. ohne Anwendung des Satzes über implizite Funktionen, berechnen. Auch die Fréchet- 
Ableitung wird in diesem Fall nicht benötigt. Stattdessen wird der gesamte Vektor ein- bzw. 
zweimal mit den Rechenregeln für die Differentiation von Vektoren und Matrizen nach einem 
Skalar, in diesem Fall nach a, abgeleitet und im Anschluss jeweils der erste Eintrag dieser 
Vektoren für die Berechnung von (4.5) und (4.6) genutzt. Für die erste Ableitung von (4.51) 
ergibt sich: 


Lemma 4.3 (Erste Ableitung des Stellgrößenvektors nach «) 
Die erste Ableitung des Stellgrößenvektors “i nach a berechnet sich zu 
uz 
új 
új > 40Mo 4, >13 
=M! M'i -M'E (4.52a) 
0a da da 
mit 
> | HTaOH+R H’«OH 
M= T T «QH | (4.52b) 
H'(1-a@)QH H'(1-a@)QH+R 
| Arad -¥ 
m=|.. u, | (4.52c) 
HTG - a)O(@xo - %) 
am [ATOM ATOM 
OM al 0, (4.524) 
aa |-H'OH -H'OH 
und 
am [ AOSx -: 
cde 1 Q |: (4.52) 
oa -H Q(®xo - X) 
Die Invertierbarkeit von M ist dabei bereits Voraussetzung für die Berechnung des Stellgrö- 
Benverktors nach Gleichung (4.51). 


4.2 Verfahren zur Schatzung des aktuellen Ubergabezustands basierend auf der menschlichen Aktion 55 


Beweis von Lemma 4.3: 
Unter Verwendung der Notation (4.52b) und (4.52c) kann Gleichung (4.51) umgeschrieben wer- 
den zu 


-=-M nm. (4.53) 


u) 
uy AM), > əm 

zA E ka (4.54) 
9a oa 0a 


M-1 
Eine Vorschrift zur Berechnung von aM ) erhält man, indem man die Gleichung 


MM! =I (4.55) 


ebenfalls durch Anwendung der Produktregel nach « ableitet. Das Ergebnis hiervon lautet: 


0 (4.56) 


ps 


aM!) 
9a 


Durch Umstellen von (4.56) nach und Einsetzen in (4.54) folgt schließlich Gleichung 


(4.522). Um den Beweis zu vervollständigen, fehlen noch die Berechnungsvorschriften für aM 
und Mm. 

Laut [Gen17, S. 190 £.] ergibt sich die Ableitung einer Matrix oder eines Vektors nach einem 
Skalar durch die Ableitung jedes Elements der Struktur in derselben Struktur. Angewendet 
auf die Elemente der Matrix M bzw. des Vektors m aus (4.52b) bzw. (4.52c) ergeben sich so die 


Gleichungen (4.52d) und (4.52e). 


Zur Berechnung der zweiten Ableitung der Fehlerfunktion (4.6) muss auch (4.52a) ein weiteres 


Mal abgeleitet werden. 
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Lemma 4.4 (Zweite Ableitung des Stellgrößenvektors nach a) 

u f 

„, | nach a berechnet sich zu 
2 


Die zweite Ableitung des Stellgrößenvektors 


32 u] 
új .,0M- [oň M>]. 
= 2M M -M'a |], (4.57) 
da? da da ðq 


wobei M,m, M und m in den entsprechenden Gleichungen (4.52b), (4.52c), (4.52d) und 


> Oa 


(4.52e) gegeben sind. 


Beweis von Lemma 4.4: 
Die Gleichung (4.57) ergibt sich unmittelbar, indem erneut die Produktregel sowie die Be- 


rechnungsvorschrift zur Bestimmung der Ableitung einer inversen Matrix gemäß (4.56) auf 


Gleichung (4.52a) angewendet werden. 


Jeweils die ersten Einträge von (4.52a) und (4.57) können dann zur Berechnung von (4.5) und 


(4.6) verwendet und so a gemäß (4.4) adaptiert werden. 


Damit wurde sowohl für die Lösung des Differentialspiels mit dem Hamilton-Ansatz als auch 
für die Lösung über den Batch-Ansatz eine Möglichkeit gefunden, wie der unbekannte Transi- 
tionsparameter aus der Aktion des Partners geschätzt werden kann. Unter Verwendung dieser 
Schätzung kann die Automation im Anschluss so an den Partner adaptiert werden, dass alle 


Transitionen ideal verlaufen. 


Auch wenn die Berechnungen für die Adaption mit dem Batch-Ansatz auf den ersten Blick 
einfacher erscheinen als bei der Adaption mit dem Hamilton-Ansatz, erzeugen die Multiplika- 
tionen der über den Prädiktionshorizont dargestellten Matrizen einen hohen Rechenaufwand. 
Dies zeigt auch der nachfolgende Abschnitt, in dem die beiden Verfahren in einer Simulation 


miteinander verglichen werden. 
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4.3 Simulation zur Adaption an einen Partner in einem 


Beispielsystem 


Die nachfolgende Simulation zeigt die Fähigkeit des in den vorherigen Abschnitten präsen- 
tierten Adaptionsverfahrens, den Transitionsparameter des Kooperationspartners zu ermit- 
teln. Nachfolgend wird zunächst das Simulationsszenario beschrieben und zwei Varianten 
vorgestellt, nach denen die Messgröße generiert wird. Die beiden Varianten unterscheiden 
sich darin, in wie weit die in der Herleitung des Adaptionsalgorithmus getroffenen Annah- 
men erfüllt sind. Im Anschluss werden die Simulationsergebnisse, getrennt nach der Methode 
für die Messwerterzeugung, gezeigt und jeweils die Adaptionsmethoden basierend auf dem 


Hamilton- und dem Batch-Ansatz miteinander verglichen. 


Simulationsszenario 


Als System wird hier ebenfalls das Feder-Dämpfer-System aus Abschnitt 3.4 verwendet. Das 
Szenario ist so gestaltet, dass Spieler 1 die Stellgröße vorgibt, während Spieler 2 aus diesem 
Wert den aktuellen Transitionsparameter schätzt. Der so ermittelte Transitionsparameter wird 
auf Werte zwischen 0 und 1 begrenzt und damit sichergestellt, dass Verhalten, welches der Mo- 
dellierung entgegensteht (a; < 0) bzw. deren Leistung übertrifft (a; > 1), auf keine Reaktion 
(a = 0) bzw. Verhalten, wie in der alleinigen Durchführung der Aufgabe (a = 1), abgebildet 
wird. Spieler 2 wählt daraufhin durch Anpassung seines Gütemaßes die passende Aktion für 
eine ideale Transition. Als Ausgangspunkt für die Adaptionsverfahren muss folglich zuerst die 
Stellgröße des ersten Spielers als fiktiver Messwert generiert werden. Zur Erzeugung wird ein 
Differentialspiel mit dem Systemmodell gemäß Gleichung (3.59) und Gütemaßen gemäß Glei- 
chung (3.60) verwendet. Das Differentialspiel wird dabei mit dem jeweils gleichen Verfahren 


gelöst, das auch für die Adaption verwendet wird. 


Wie in der Simulation aus Abschnitt 3.4 erwartet Spieler 1 drei Transitionen: Eine erste Über- 
gabe mit linearem Abfall des Transitionsparameters über 1 s, eine zweite Übergabe mit einem 
Plateau bei @ = 0,3 und eine letzte Übergabe, deren Transitionsverlauf identisch zur Ersten 
ist. Für die Generierung des Messwerts wird angenommen, dass der Transitionsparameter des 
Mitspielers entgegengesetzt verläuft. Erfüllt der adaptierende Spieler diese Vorgabe sind die 
resultierenden Transitionen folglich ideal (vgl. Definition 3.6). Der Verlauf der Transitions- 


parameter für die Generierung des fiktiven Messwerts ist in Abbildung 4.2 dargestellt. 


Die Referenzposition liegt während der ersten beiden Transitionen bei 1 m, für die dritte Tran- 
sition bei 0 m. Die Parameter des Systems und der Gütemaße werden identisch zur vorherigen 
Simulation in Abschnitt 3.4 gewählt und sind in der dort angegebenen Tabelle 3.1 aufgeführt. 


Die Optimierung wird ebenfalls wie zuvor über einen gleitenden Horizont der Lange 1 s bei 
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Zeit in s 


Abbildung 4.2: Transitionsparameterverlauf fiir Spieler 1 (durchgezogene Linie) und Spieler 2 (gestrichelte Linie) im 
Differentialspiel zur Generierung der vorgegebenen Aktion fiir das Simulationsszenario 


einer Diskretisierungszeit von 20 ms in MATLAB/Simulink R2016a auf demselben Computer- 
system (Intel Core i7-6600U; 2,81 GHz; 12 GB RAM) durchgeführt. 


Dieses Szenario wird sowohl fiir das auf dem Hamilton-Ansatz basierende als auch fir das auf 
dem Batch-Ansatz basierende Adaptionsverfahren zweimal simuliert. Die beiden Durchgänge 
unterscheiden sich in der Art und Weise, wie aus den Transitionsparameterverläufen die Stell- 
größe von Spieler 1 erzeugt wird. In der ersten Variante werden die momentanen Werte der 
Transitionsparameter für den gesamten Horizont der gegenwärtigen Optimierung verwendet. 
Der fiktive Messwert wird somit durch einem konstanten Transitionsparameter erzeugt. Dies 
entspricht der Annahme, die auch für die Schätzung getroffen wurde (vgl. Abschnitt 4.1). Erst 
einen Abtastschritt später wird der Wert aktualisiert und für den nächsten Optimierungshori- 
zont verwendet. In der zweiten Variante wird stattdessen der zukünftige Verlauf von a korrekt 
vorhergesagt und somit die exakten Werte für die Messwerterzeugung verwendet. Die Ergeb- 


nisse der beiden Varianten werden in den folgenden Abschnitten nacheinander gezeigt. 


Simulationsergebnisse bei Generierung des Messwerts mit konstantem 


Transitionsparameter über dem Optimierungshorizont 


Abbildung 4.3 zeigt das Ergebnis der Simulation für die Variante mit konstantem Transitions- 
parameter über dem Optimierungshorizont. Es ist zu erkennen, dass das Adaptionsverfahren 
mit dem Hamilton-Ansatz den vorgegebenen Transitionsparameterverlauf nahezu identisch 
nachbildet. Der Betrag des Fehlers in «æ beträgt im Mittel nur 0,004 bei einem Maximalwert von 
0,023. Damit gelingt es, den Verlauf für den zweiten Spieler so zu wählen, dass nahezu ideale 
Transitionen entstehen. Die optimalen stationären Positionen, die für eine ideale Transition 
erzielt werden sollten, betragen 0,75 m für die ersten beiden Transitionen und 0 m für die drit- 
te Transition. Während der Übergabeprozesse beträgt die Abweichung der Istposition zu den 
zugehörigen optimalen Positionen maximal 0,01 m. Wird der Batch-Ansatz zur Durchführung 
der Adaption verwendet, ist die Schätzung von « geringfügig schlechter. Der Betrag des Feh- 


lers liegt im Schnitt bei 0,016 mit einem Maximalwert von 0,127 während der dritten Übergabe. 
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Zeit in s 
(a) Geschätzter Transitionsparameterverlauf im Vergleich zur Vorgabe (in schwarz, nahezu vollständig verdeckt) 
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Zeit in s 
(b) Stellgrößenverlauf für Spieler 1 (durchgezogene Linie) und Spieler 2 (gestrichelte Linie) 
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Zeit in s 
(c) Verlauf der Position (durchgezogene Linie) und der Referenzposition (gestrichelte Linie) 


v in m/s 


Zeit in s 
(d) Verlauf der Geschwindigkeit 


Abbildung 4.3: Simulation des Beispielszenarios unter Verwendung der Adaption basierend auf dem Hamilton- (rot) 
und dem Batch-Ansatz (blau) bei Erzeugung der Messgröße mit konstantem Transitionsparameter 
über dem Optimierungshorizont 
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Die Abweichungen sind auf numerische Ungenauigkeiten in der Berechnung der Diskretisie- 
rung des Systems und der Inversion der Matrix M aus Gleichung (4.52b) zurückzuführen. Die 
Qualität der Schätzung ist ausreichend, um auch für diesen Fall kaum Abweichungen von der 


optimalen Position zu erhalten (maximale Abweichung 0,03 m). 


Wie schon beim Vergleich der Ansätze zur Lösung des Differentialspiels liegt der Hauptunter- 
schied der Verfahren in der Rechenzeit. Mit dem Hamilton-Verfahren dauert die Berechnung 
eines Adaptionsschritts 0,94 ms und damit weniger als ein Fünftel der Zeit, die ein Schritt mit 
dem Batch-Ansatz (5,38 ms) benötigt. 


Simulationsergebnisse bei Generierung des Messwerts mit zeitvariantem 


Transitionsparameter über dem Optimierungshorizont 


In der zweiten Variante wird statt eines über dem Optimierungshorizont konstanten Transi- 
tionsparameters ein zeitvarianter Verlauf zur Messwerterzeugung verwendet. Dadurch ent- 
spricht die Art der Erzeugung nicht mehr dem Modell im Adaptionsalgorithmus. Abbildung 
4.4 zeigt die geschätzten Transitionsparameter sowie die Trajektorien der Stell- und Zustands- 


größen, wenn die Stellgröße von Spieler 1 auf diese Weise erzeugt wird. 


Diese Methode liefert für das simulierte Szenario ebenfalls für beide Adaptionsverfahren qua- 
litativ vergleichbare Ergebnisse. Der mittlere Betrag des Fehlers zwischen geschätztem und 
vorgegebenen Transitionsparameter liegt mit 0,058 für den Hamilton- und 0,053 für den Batch- 
Ansatz höher als bei der ersten Variante. Insbesondere die maximale Differenz zur Vorgabe ist 
mit einem Wert von 0,580 (Hamilton-Ansatz) bzw. 0,600 (Batch-Ansatz) sehr hoch. Betrachtet 
man die ersten beiden Übergaben, so fällt auf, dass die geschätzten Werte des Transitions- 
parameters a dem Verlauf des zur Erzeugung der Stellgröße des vorgebenden Partners u1 
verwendeten Transitionsparameters vorauseilen. Die Ursache hierfür liegt im zeitvarianten 
Verlauf von a, welcher für die Generierung der Stellgröße uy genutzt wird. Das Adaptions- 
verfahren nimmt hingegen einen konstanten Wert von @ über dem Optimierungshorizont an. 
Wie bereits in der Simulation aus Abschnitt 3.4 beschrieben, hat die Änderung von @ in der 
Zukunft zur Folge, dass sich die aktuelle Stellgröße bereits früher verändert, um das für den 
Gesamtverlauf optimale Ergebnis zu erzielen. Soll diese aktuelle Stellgröße stattdessen durch 
ein q erzeugt werden, welches über dem Horizont konstant ist, muss die Änderung von u1 
zum aktuellen Zeitpunkt bei gleichem Zustand unmittelbar eine Veränderung von « zur Fol- 
ge haben. Es wird also gesucht, welches konstante a dieselbe aktuelle Stellgröße erzeugt, wie 
der zeitvariante Übergabeverlauf über dem Optimierungshorizont. Nur wenn das a des ersten 
Partners über den gesamten Horizont gleich ist (wie vor und am Ende einer Transition oder 
bei dem Plateau der zweiten Übergabe) ist das geschätzte a identisch zur Vorgabe. Hierbei 
ist hervorzuheben, dass die Größe a des Partners, der die Transition vorgibt, ein Modellpara- 


meter und keine physikalisch messbare Größe ist. Die Abweichung zwischen dem vorgegeben 
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Abbildung 4.4: Simulation des Beispielszenarios unter Verwendung der Adaption basierend auf dem Hamilton- (rot) 
und dem Batch-Ansatz (blau) bei Erzeugung der Messgröße mit zeitvariantem Transitionsparameter 
über dem Optimierungshorizont 
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und geschätzten Verlauf von « ist dahingehend von reduzierter Relevanz, solange der adaptive 
Partner die vom initiierenden Partner erwartete Stellgröße aufbringt. Die Positionstrajektorie 
zeigt, dass dies für die gesamte Simulationsdauer ähnlich gut wie bei der vorherigen Variante 
zur Generierung des fiktiven Messwerts funktioniert. Mit dem Hamilton-Ansatz beträgt die 


maximale Abweichung 0,02 m und mit dem Batch-Ansatz 0,03 m. 


Eine Besonderheit ergibt sich bei der Betrachtung der dritten Übergabe. Da die Referenz hier 
identisch zur Ruhelage des Systems ist, besteht die optimale Aktion beider Spieler daraus als 
Stellgröße den Wert Null aufzubringen, sobald diese Ruhelage erreicht ist. Dies gilt unabhän- 
gig vom Wert des Transitionsparameters, sodass sich einerseits fehlerhafte Werte nicht auf 
die Stellgrößen auswirken, andererseits aus der Stellgröße keine Rückschlüsse auf a gezogen 
werden können. Mathematisch betrachtet, führt das zu e = e’ = e” = 0, wodurch die Update- 
Richtung aus Gleichung (4.4) nicht mehr definiert ist. Wie in Abbildung 4.4 gezeigt, ergeben 
sich durch numerische Ungenauigkeiten in der Berechnung trotzdem Schatzwerte für a, wobei 
diese zum Teil deutlich von der Vorgabe abweichen. Trotz des großen Fehlers in der Schätzung 
bleiben die Spieler im Zielzustand, da es bedeutungslos ist, welchen Anteil die Partner an einer 


optimalen, gemeinsamen Stellgröße von ON haben. 


Da sich die Simulationsdurchgänge nur hinsichtlich des künstlich erzeugten Messwerts, nicht 
jedoch bezüglich des verwendeten Adaptionsalgorithmus unterscheiden, ist die Berechnungs- 
zeit der Adaptionsverfahren identisch zu den Ergebnissen bei Vorgabe mit konstantem Tran- 


sitionsparameter. 


Die Simulationsergebnisse zeigen, dass die in diesem Kapitel vorgestellten Adaptionsverfah- 
ren praktisch umsetzbar sind und es hiermit möglich ist, die Vorgabe eines Partners so zu 
ergänzen, dass jegliche Transitionen ideal im Sinne von Definition 3.5 verlaufen. Damit wurde 
eine Methode gefunden, wie die aktuelle Übernahmefähigkeit des menschlichen Partners aus 
dessen Handlung abgeleitet werden kann. Daraufhin ist es möglich, die Automation so an- 
zupassen, dass sie den Menschen adäquat unterstützt und optimal mit diesem kooperiert. Im 
nächsten Kapitel werden die neuen Modellierungs- und Adaptionsverfahren aus diesem und 


dem vorherigen Kapitel anhand der Interaktion mit menschlichen Partnern evaluiert. 


5 Experimentelle Validierung 


In diesem Kapitel werden die in Kapitel 3 und 4 vorgestellten Verfahren praktisch angewendet, 
um sie im Zusammenspiel mit menschlichen Kooperationspartnern analysieren und bewerten 
zu können. Dazu wurden drei Experimente konzipiert und durchgeführt. Im ersten Experiment 
wird die Übergabe einer abstrahierten Lenkaufgabe mit Hilfe der differentialspielbasierten Mo- 
dellierung aus Kapitel 3 mit anderen Übergabemethoden verglichen. Der Übertrag auf die An- 
wendung im hochautomatisierten Fahren und der Vergleich der kooperativen Transition mit 
der konventionellen, direkten Transition erfolgt in einem zweiten Experiment. Darauf auf- 
bauend wird in einem dritten Experiment untersucht, ob eine mit dem Verfahren aus Kapitel 
4 individuell angepasste Transition Vorteile gegenüber einem starr vorgegebenen Übergabe- 
verlauf aufweist. In den nachfolgenden Abschnitten werden jeweils das Design der einzelnen 
Versuche präsentiert sowie die Ergebnisse gezeigt und interpretiert, bevor eine abschließende 
Gesamtbewertung vorgenommen wird. Zur besseren Unterscheidung der Kooperationspart- 
ner wird in allen nachfolgenden Beschreibungen der Index A für automationsbezogene Para- 


meter und Variablen sowie der Index M für die Größen des Menschen verwendet. 


5.1 Vergleich von Übergabekonzepten 


Es soll zunächst experimentell die Frage beantwortet werden, ob graduelle Transitionen Vor- 
teile gegenüber direkten Wechseln bei der Ausführung der Tätigkeit besitzen. Dafür wurde 
am Institut für Regelungs- und Steuerungssysteme (IRS) ein Versuch aufgebaut, bei dem sich 
Mensch und Automation mit der Erfüllung der Aufgabe abwechseln und so verschiedene Über- 
gabekonzepte untersucht werden können. Als Aufgabe wurde eine stark abstrahierte Fahrauf- 
gabe verwendet, welche auf das Folgen einer Lenkradwinkeltrajektorie reduziert wurde. Diese 
Reduktion besitzt die Vorteile, dass einerseits Assoziationen zu realen Fahrten und somit unbe- 
kannte Störeinflüsse vermieden werden können und andererseits das Ziel der Aufgabe eindeu- 
tig vorgegeben werden kann. Teilpakete des Experimentaufbaus wurden in Rahmen der Ba- 
chelorarbeiten [Ayl16], [Har17] und [Wör17] bearbeitet. Die Durchführung des Experiments 
war Bestandteil der Bachelorarbeit [Haa18]. Das komplette Experiment und seine Ergebnisse 
wurden in [LHFH18] veröffentlicht. 
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5.1.1 Versuchsbeschreibung 


Die Beschreibung des Versuchs gliedert sich in fünf Teile. Im ersten Teil wird zunächst der Ver- 
suchsaufbau vorgestellt. Daraufhin wird die Umsetzung eines Regelungsmoduls gezeigt, mit 
dem sich verschiedene Ubergabekonzepte realisieren lassen. Die Auswahl der getesteten Uber- 
gabekonzepte erfolgt im nachsten Teil. Die im Experiment verwendeten Testszenarien und der 
Ablauf des Experiments sind Gegenstand des vierten Abschnitts. Im letzten Teil werden die 
Bewertungskriterien fiir die Ubergabekonzepte festgelegt und dazugehérige Hypothesen auf- 
gestellt. 


Versuchsaufbau 


Als Eingabegerat fiir den Lenkradwinkel steht dem Versuchsteilnehmer ein Force-Feedback 
Lenkrad des Typs SENSO-Wheel SD-LC mit einer Auflösung von 0,009° und einem Nennmo- 
ment von 7,5 Nm zur Verfügung [SEN10]. Die Aufzeichnung der Lenkradsignale sowie die 
Berechnung der Sollmomente erfolgen auf einem dSpace ds1006 Prozessorboard. Die aktuel- 
le Lenkradposition wird dem Nutzer als grüner Punkt auf einem Bildschirm dargestellt. Der 
Punkt befindet sich im unteren Viertel der Anzeige und kann über den Lenkradwinkel auf einer 
horizontalen Linie bewegt werden. Der Solllenkradwinkel ö wird durch eine schwarze Linie 
angezeigt, welche sich mit der konstanten Geschwindigkeit von 0,144 m/s vertikal unter der 
Positionsmarkierung fortbewegt. Dadurch entsteht der Eindruck einer Fahrt des Punktes nach 
oben. Übergaben werden durch ein gelbes Warndreieck in der oberen Mitte des Bildschirms 
angezeigt, welches die verbleibenden Sekunden bis zum Abschluss der Übergabe beinhaltet. 
Die Anzeige wird von einem Warnton begleitet, der sekündlich wiederholt wird. Zudem gibt 
ein Symbol in der linken unteren Ecke Auskunft darüber, ob gerade die Automation (Symbol A) 
oder der Mensch (Symbol M) für die Durchführung der Aufgabe zuständig ist. Das grafische 
Interface und dessen Anbindung an die Lenkradsignale wurden im Rahmen der Bachelorarbeit 
[Ayl16] erstellt. 


In den Phasen, in denen die Automation die Lenkung übernimmt, werden die Versuchsteil- 
nehmer abgelenkt, um den Verlust des für die Lenkaufgabe nötigen Situationsbewusstseins 
zu erzeugen. Hierfür wurde eine visuell, motorisch und kognitiv fordernde Nebenaufgabe ge- 
sucht. Besonders involvierend sind hier Spiele, vor allem dann, wenn sie eine hohe Motivation 
bieten und schwer unterbrechbar sind [KVV16]. Weiterhin sollte die Nebenaufgabe schnell 
verständlich und leicht zu erlernen sein. Um diese Anforderungen zu erfüllen, wurde deshalb 
im Rahmen der Bachelorarbeit [Har17] ein Memory-Spiel programmiert, bei dem sieben Paa- 
re von identischen Symbolen auf einem Touchpad gefunden werden müssen. Sind alle Paare 
ermittelt, werden diese wieder verdeckt gemischt und das Spiel wird fortgesetzt. Das Display 


zeigt die Anzahl bisher gefundener Paare in der Mitte an. Die Bedienung erfolgt mit Hilfe eines 
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Eingabestifts. Hierdurch wird der Wechsel der Tatigkeit zusatzlich erschwert, da vor der Uber- 
nahme der Lenkung zunächst der Stift abgelegt werden muss. Der gesamte Versuchsaufbau ist 
in Abbildung 5.1 dargestellt. 


Abbildung 5.1: Versuchsstand des Experiments zum Vergleich von Übergabekonzepten 


Verwendeter Regelalgorithmus 


Der Einfluss der Momente von Mensch und Automation uy bzw. ua auf den Lenkradwinkel 
ö kann mit der folgenden Zustandsraumgleichung modelliert werden: 
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einer virtuell eingefügten Feder c bzw. eines virtuell eingefügten Dämpfers d, mit denen sich 
die Dynamik des SENSO-Wheels konfigurieren lässt. Dieses Modell bildet die Grundlage für 
den Reglerentwurf. 


Die Automation wurde mit Hilfe eines Regelungsmoduls umgesetzt, welches erlaubt, über drei 
Parameter diverse Transitionskonzepte abzubilden. Kern des Moduls ist ein Zweispieler LQ- 
Differentialspiel nach Definition 3.6, wobei die Anforderung für eine ideale Transition nach 
Gleichung (3.58e) fallen gelassen wird und sowohl ag als auch ay nach Belieben vorgegeben 
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werden können. Zum einen lässt sich damit über a, der Beteiligungsgrad der Automation ein- 
stellen, zum anderen kann über ay vorgegeben werden, welche Beteiligung die Automation 
für den Menschen annimmt und so bei der Berechnung der optimalen Stellgröße berücksich- 
tigt. Die Berechnung erfolgt mit dem Batch-Ansatz aus Abschnitt 3.2.2, wobei die Methode 
sich auf die klassische Anwendung des Batch-Ansatzes für die optimale Regelung reduziert, 
falls a, durchgehend 0 bleibt und keine Beteiligung des Menschen im Regler berücksichtigt 
wird (s. [BBM17]). Die so ermittelte optimale Stellgröße der Automation u, kann weiter mo- 
difiziert werden. Hierfür wird der Faktor x als neuer Parameter eingeführt, mit dem der Wert 


gemäß 
um = Kuh, K € [0,1] (5.2) 


skaliert werden kann. Dadurch wird es möglich, direkt auf die Stellgröße Einfluss zu nehmen 
und so die Automation beispielsweise durch einen Wechsel von « von 1 auf 0 in einem Zeit- 


schritt zu deaktivieren. 


Für die Berechnung des Lenkmoments der Automation wird das System mit einer Abtastzeit 
von 0,025 s diskretisiert. Der Prädiktionshorizont wurde zu 1,5 s gewählt und beinhaltet damit 
bei der gewählten Geschwindigkeit denselben Streckenabschnitt, den der Mensch auf dem 
Bildschirm als Vorschau angezeigt bekommt. Die Modellparameter c und d wurden entspre- 
chend der Konfiguration des SENSO-Wheels gewählt, das Trägheitsmoment I des Lenkrads 
mittels des Least-Squares-Verfahren wie in [Lud11] beschrieben geschätzt. Die Zustandsge- 
wichtungsmatrizen Q* und S* werden als identische Diagonalmatrizen der Form diag(g;, q) 
ausgelegt. Die Wahl der Gewichte der Gütemaßmatrizen erfolgt heuristisch in der Art, dass die 
Automation die Aufgabe alleine erfüllen kann. Die Gewichte des im Differentialspiel benötig- 
ten Modells des Menschen werden gemäß Definition 3.6 identisch gewählt. Die Zahlenwerte 


der Gütemaß- und Systemparameter sind in Tabelle 5.1 angegeben. 


Tabelle 5.1: Gütemaß- und Modellparameter für das Experiment zum Vergleich der Übergabekonzepte 


Parameter Wert Einheit 
T 0,04 Nm sĉ?/rad 
c 2,29 Nm/rad 
d 0,57 Nm s/rad 
që 35 1/rad? 
qå 0 s?/rad? 


R 1 1/N? 
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Ubergabekonzepte 


In diesem Abschnitt werden die fiir das Experiment genutzten Ubergabekonzepte und die zu- 
grunde liegenden Verläufe der Parameter aa, a und x behandelt. Um die Vergleichbarkeit 
zwischen den Übergabekonzepten zu gewährleisten, wurden diese so parametriert, dass die 
Zeiträume der Transitionsphasen einheitlich sind. Vor Beginn einer Transitionsphase ist das 
Verhalten der Automation für alle Konzepte identisch und spätestens am Ende dieser Phase 
liefert die Automation keinen Momentenbeitrag mehr für das Lenkrad. Da die Zeit bis zur 
Übernahme des Lenkrads durch den Probanden mit dem gegebenen Versuchsaufbau nicht un- 
mittelbar messbar ist, wurde in einem Vorversuch im Rahmen der Bachelorarbeit von [Wör17] 
die durchschnittliche Zeit bis zur ersten Lenkreaktion ermittelt. Für die zehn Versuchsteilneh- 
mer ergab sich eine mittlere Reaktionszeit von 1,835 s, weshalb die Zeit für die Präparations- 
phase auf 2 s festgelegt wurde. Für die Transitionsphase wurden weitere 3s gewählt, sodass 


die Übergabe spätestens 5 s nach der Ankündigung abgeschlossen ist. 


Es wurden fünf verschiedene Umsetzungen für die Übergabe der Aufgabe miteinander vergli- 
chen. In zwei Umsetzungen wird die Automation direkt, d.h. in einem Schritt, abgeschaltet, 


wobei sich die beiden Varianten wie folgt im Zeitpunkt der Abschaltung unterscheiden: 
« Frühestmöglich Abschalten (AF) 
« Spätestmöglich Abschalten (AS) 


In den anderen Übergabekonzepten erfolgt die Abschaltung graduell. Die verwendeten Me- 
thoden lauten: 


« Skalierung des Reglerausgangs (GS) 
« Reduktion der Beteiligung eines Optimalreglers (GO) 
e Wechsel der Rollen im Differentialspiel (GD) 


Alle Transitionen beginnen bei einer vollständig aktiven Automation, was durch die Parame- 
trierung aa = 1, am = 0 und « = 1 sichergestellt ist. Durch Veränderung eines oder mehrerer 
dieser Werte werden die oben genannten Übergabemethoden realisiert. Die Abschaltung der 
Automation für die Konzepte AF und AS erfolgt durch einen direkten Wechsel des Parameters 
x von 1 auf 0 zu Beginn bzw. am Ende der Transitionsphase. Auch für das Konzept GS erfolgt 
das Abschalten über x, wobei der Parameter hier über die gesamten Transitionsphase hinweg 
linear auf 0 abfällt. Im vierten Verfahren GO wird hingegen aq zur Umsetzung der graduel- 
len Abschaltung verwendet. Aufgrund der Prädiktionsfähigkeit des Optimalreglers muss der 
Wert zu Beginn der Transitionsphase noch für einen Optimierungshorizont unverändert blei- 
ben, damit die Transition nicht bereits früher vorhergesehen wird. Erst danach fällt a, linear 
auf 0 ab. Die letzte Ubergabemethode GD verwendet als einzige zusätzlich den Parameter ay, 


wodurch ein Differentialspiel entsteht. Der Verlauf von ag ist identisch zum Verfahren GO und 
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am verlauft gegenlaufig dazu. Auf diese Art wird tiber das Modell des menschlichen Verhaltens 
dessen Aktion für die Ermittlung der optimalen Stellgröße der Automation berücksichtigt mit 
dem Ziel eine ideale Transition zu erzeugen. Abbildung 5.2 verdeutlicht, welche Parameter für 
die verschiedenen Transitionsmethoden genutzt werden und gibt deren Verlauf an. Die nicht 
explizit angegebenen Parameter behalten jeweils ihren Initialwert von 1 für aa und x bzw. 0 


für am bei. 


Präparationsphase Transitionsphase 


(2s) (3s) 


1.0 


— AF (x) 
— AS (k) 
= GS (k) 
= GO (aa) 
=== GD (aa) 
«#181 GD (ay) 
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Transitionsparameter 


| | 
Übernahme- Ende der 
aufforderung Übergabe 


Zeit 


Abbildung 5.2: Verlauf der zur Umsetzung der Übergabe genutzten Parameter x, aa und ay für alle im Experiment 
untersuchten Transitionsmethoden 


Versuchsdurchführung 


Für den Vergleich der fünf Übergabemethoden wurden zwei Referenzszenarien betrachtet. Da 
keine Abhängigkeit des Ergebnisses von der Richtung des Manövers zu erwarten ist, wird im 
Folgenden nicht zwischen Manövern nach rechts und nach links unterschieden. In Szenario 
„Halten“ liegt die Referenz während der gesamten Übergabe bei einem konstanten Wert von 
+90°, die Versuchsperson muss also das Lenkrad entgegen der Rückstellkraft der Feder festhal- 
ten. Im Szenario „Anstieg“ beginnt die Übergabe bei 0°. Bis 1s nach Beginn der Transitions- 
phase ändert sich der Solllenkradwinkel nicht. Danach steigt er betragsmäßig über 1s bis auf 
+90° an und verbleibt dort. Hier unterscheidet sich folglich der Zustand am Ende der Übergabe 
im Vergleich zur Ausgangssituation. Der Verlauf des Solllenkradwinkels der beiden Szenarien 
ist grafisch in Abbildung 5.3 veranschaulicht. Die Übergaben vom Probanden zurück an die 
Automation erfolgen stets bei einer Referenzvorgabe von 0° und erfordern somit kein Moment 


während der Übergabe. In den Phasen, in denen Mensch oder Automation die Lenkung allei- 
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ne übernehmen, wechselt die Solltrajektorie unregelmäßig zwischen Abschnitten mit -90°, 0° 


und 90° hin und her. Der Sollwert für die Lenkwinkelgeschwindigkeit wird durchgehend zu 0 


gewählt. 
] ] ] 
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Abbildung 5.3: Solllenkradwinkel im Szenario „Halten“ (gestrichelt) und im Szenario „Anstieg“ (gepunktet) 


Das Experiment beginnt für jeden Probanden mit einem zweiminütigen Testlauf, bei dem er 
sich mit dem Versuchsaufbau vertraut machen kann. Anschließend erfolgen die fünf Versuchs- 
durchläufe mit den verschiedenen Übergabemethoden in zufälliger Reihenfolge. Jeder dieser 
Durchgänge dauert vier Minuten und enthält jeweils eine Übergabe der Kategorie „Halten“ 
und eine der Kategorie „Anstieg“. Auch hier sind Zeitpunkte und Reihenfolge der Szenarien 
randomisiert. Die Transitionen der Aufgabe zurück an die Automation sind in diesem Experi- 


ment trivial und werden nicht ausgewertet. 


Bewertungskriterien 


Um die Frage zu beantworten, welches der im Experiment verwendeten Ubergabekonzepte die 
besten Ergebnisse liefert, werden sowohl objektive als auch subjektive Kriterien angewendet. 
Zur objektiven Bewertung werden die während der Versuchsdurchführung aufgezeichneten 
Messgrößen verwendet. Diese sind einerseits der vom SENSO-Wheel bereit gestellte Lenkrad- 
winkel ô und die Lenkradwinkelgeschwindigkeit ô, andererseits das Lenkmoment der Auto- 
mation ua als Sollwert am Reglerausgang. Der Grad der Aufgabenerfüllung wird anhand des 
Fehlers ô- ô im Zeitintervall von 1 s vor Beginn der Transitionsphase bis 1,5 s nach Ende dieser 
Phase beurteilt, was somit dem Zeitraum von 1 bis 6,5 s nach der ersten Übernahmeaufforde- 


rung entspricht. Als Kenngröße K ş wird der mittlere absolute Fehler 


1x = 
Ks = — X. |ô- ôl (5.3) 
n 
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uber alle Messwerte in diesem Zeitintervall berechnet. 


Es wird die Hypothese formuliert, dass der mittlere Fehler über alle Versuchspersonen pix 


entsprechend der Reihenfolge der vorgestellten Konzepte abnimmt und somit 


HK,AF > HK,AS > HK,GS > HK,GO > HK,GD (5.4) 


gilt. Zum Test wird diese Hypothese in paarweise Vergleiche aller Kombinationsmöglichkeiten 
zerlegt, welche im Anschluss mit einseitigen Zweistichproben-t-Tests für gepaarte Stichpro- 


ben geprüft werden [MS19]. Für je zwei Werte ux ı und ug 2 wird die Nullhypothese 


Ho: HK, < HK,2 (5.5) 


aufgestellt. Mit dem Testverfahren wird anschließend geprüft, ob und ggf. mit welchem Signi- 
fikanzniveau diese Hypothese abgelehnt und damit die Alternativhypothese ux.2 > pK, als 
Bestandteil von Gleichung (5.4) angenommen werden kann. Der Unterschied zwischen den 
Mittelwerten zweier Transitionsmethoden wird als statistisch signifikant, sehr signifikant bzw. 
hochsignifikant betrachtet, wenn die Nullhypothese mit einem Signifikanzniveau von 5%, 1% 
bzw. 0,1% abgelehnt werden kann [BD06]. 


Um neben den objektiven Kriterien auch eine subjektive Einschätzung der Versuchsteilneh- 
mer zu erhalten, wurden zudem zwei Fragen ausgewertet, welche die Probanden nach jedem 


Versuchsdurchgang beantworteten. Die Fragen lauten: 
e Wie gut konnten Sie der vorgegebenen Linie während der Übergabe folgen? 
e Wie empfanden Sie das Lenkgefühl während des Ubergabevorgangs? 


Die Beantwortung erfolgt jeweils durch Ankreuzen auf einer fünfstufigen Skala mit den Stufen 
von sehr gut bis sehr schlecht für die erste bzw. angenehm bis unangenehm für die zweite 


Frage. 


5.1.2 Ergebnisse 


Insgesamt nahmen 41 Versuchspersonen (6 weiblich, 35 männlich) im Alter zwischen 21 und 
57 Jahren (Mittelwert 26,63; Standardabweichung 7,08) an dem Versuch teil. Sechs Probanden 
wurden aus der Datenmenge ausgeschlossen, da Sie mindestens eine Aufforderung zur Über- 
nahme verpasst oder ignoriert und die Aufgabe daraufhin erst sehr spät angenommen haben. 
Die verbleibenden 35 Personen lieferten mit jeweils einer Übergabe pro Szenario unter Nut- 


zung fünf verschiedener Übergabekonzepte eine Datenbasis von 350 Übergabesituationen. Die 
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Vorstellung der Ergebnisse erfolgt in drei Teilen. Zunächst werden die Trajektorien der Lenk- 
radwinkel und Automationsmomente fiir die verschiedenen Transitionskonzepte und Szena- 
rien gezeigt. Aus der Lenkradwinkeltrajektorie kann der mittlere absolute Fehler zur Vorgabe 
ermittelt werden. Die Angabe dieser Kennzahl und der statistische Vergleich der Ubergabeme- 
thoden erfolgt im zweiten Teil. Den Abschluss der Ergebnisse bildet die Auswertung der an 


die Versuchsteilnehmer gestellten Fragen. 


Lenkradwinkeltrajektorien 


Die Ubergabesituationen werden getrennt nach den Szenarien betrachtet. Zur gemeinsamen 
Darstellung der Ergebnisse für alle Probanden werden die Signale der Manöver in Richtung 
des Referenzwerts -90° an der Nullachse gespiegelt und so alle Manöver in die gleiche Rich- 
tung von 90° dargestellt. Abbildung 5.4 zeigt die Lenkwinkelverläufe der 35 Probanden für das 


Szenario „Halten“, in dem der Lenkwinkel durchgehend bei 90° liegen soll. 


Zu Beginn des Ausschnitts, also 1s nach der ersten Aufforderung an die Versuchsperson die 
Aufgabe zu übernehmen, führt die Automation die Positionierung des Lenkrads noch alleine 
und in allen Fällen identisch durch. Mit den Parametern aus Tabelle 5.1 ergibt sich ein statio- 
närer Lenkradwinkel von ca. 76° als Kompromiss zwischen Abweichung zum Referenzwinkel 
von 90° und dem Stellaufwand, um der Feder des Systems mit Ruhelage 0° entgegenzuwir- 
ken. Im Gegensatz dazu bringen die Probanden nach Übernahme des Lenkrads das zusätzliche 
Lenkmoment auf, um das Lenkrad auf den Referenzwinkel zu bewegen und dort zu halten. 
Der Startzeitpunkt für den Übergang ist hierbei nicht identisch zum vordefinierten Beginn der 
Transitionsphase 2s nach der Übernahmeaufforderung, sondern variiert zwischen den Teil- 
nehmern. Die ersten Reaktionen erfolgen bereits eine halbe Sekunde vorher, während bei 
vereinzelten Probanden mehr als 4s vergehen, bis der Lenkradwinkel in Richtung des Soll- 
werts von 90° geführt wird. Der Erfüllungsgrad der Aufgabe während dieses Übergangs von 
Automation zum Menschen wird anhand der Abweichung vom Referenzwert beurteilt. Die 
Lenkradwinkeltrajektorien zeigen, dass sich die verschiedenen Übergabekonzepte in diesem 


Szenario diesbezüglich sichtbar voneinander unterscheiden. 


Die deutlichsten Abweichungen ergeben sich für das Konzept AF, bei dem das Assistenzmo- 
ment sofort zu Beginn der Transitionsphase abgeschaltet wird. Mehr als die Hälfte der Ver- 
suchsteilnehmer können den Wegfall nicht sofort kompensieren. Durch die Eigendynamik des 
Systems bewegt sich das Lenkrad solange auf die stabile Ruhelage bei 0° zu, bis die Probanden 
das nötige Lenkmoment aufbringen. Bis dahin vergrößert sich der Abstand zum Sollwert. Teil- 
weise reagieren die Versuchspersonen erst nach Erreichen der Nulllage. Auch für die Proban- 
den, die bereits vor Beginn der Transitionsphase mit der Übernahme der Aufgabe begonnen 
haben, ist ein Einbruch des Lenkradwinkels im Zeitraum zwischen 0,2 s und 0,3 s nach Beginn 


der Transitionsphase zu erkennen. Dies trifft auch für das Konzept AS zu, jedoch erfolgt hier 
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Zeit nach Übernahmeaufforderung in s 
(d) Graduelle Methode Reduktion der Beteiligung des Optimalreglers (GO) 
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Zeit nach Übernahmeaufforderung in s 
(e) Graduelle Methode Differentialspiel (GD) 


Abbildung 5.4: Lenkradwinkelverläufe aller Probanden im Szenario „Halten“, aufgeteilt nach Übergabemethode. Die 


Referenz (gestrichelte Linie) beträgt im gesamten Szenario 90° und die Transitionsphase liegt im In- 
tervall von 2s bis 5 s nach dem Signal zur Übernahme. 
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das Abschalten am Ende der Transitionsphase, also 5 s nach der Ubernahmeaufforderung. Da 
die Automation bis dahin aktiv bleibt, vergrößert sich die Differenz zum Sollwert im Gegensatz 
zur Variante AF auch dann nicht, wenn die Versuchsteilnehmer erst im Laufe der Transition- 
phase mit der Aufgabe beginnen. Wird die Skalierung des Reglerausgangs (GS) zur Erzeugung 
einer graduellen Übergabe genutzt, zeigen die Trajektorien, dass sich der Abstand zum Soll- 
lenkwinkel erhöht, bis die Probanden eingreifen und die Referenzposition einstellen. Da jedoch 
noch unterstützendes Moment verbleibt, erfolgt der Abfall nicht so schnell wie in Variante AF. 
Bei den Konzepten GO und GD ist dies nicht erkennbar. Die Ursache hierfür zeigt sich bei Be- 
trachtung der in Abbildung 5.5 dargestellten Lenkmomente der Automation. Im Gegensatz 
zum sprunghaften Abschalten der Übergabekonzepte AF und AS nimmt das Automationsmo- 
ment zwar bei allen anderen Verfahren graduell ab, die Varianten unterscheiden sich jedoch in 
der Form der Reduktion. Durch die lineare Skalierung über die gesamte Transitionsphase hin- 
weg verringert sich das Moment der Automation bei Konzept GS bereits sehr früh, während die 
Methoden, die den Transitionsparameter innerhalb des Optimierungsproblems berücksichti- 
gen, eine längere Zeit ein hohes Moment bereit stellen, welches am Ende der Transitionsphase 
steiler abfällt. Wird hierbei durch die Verwendung eines Differentialspiels die erwartete Über- 
nahme durch den Menschen mit modelliert, erfolgt dieser Abfall früher, als wenn der Regler 


unter der Annahme operiert, allein für die Lösung der Aufgabe zuständig zu sein. 


Im zweiten betrachteten Szenario „Anstieg“ findet die Übernahmeaufforderung bei einem Soll- 
wert von 0° statt. Erst 3s später soll der Lenkradwinkel innerhalb von 1s auf 90° geführt und 
dort gehalten werden. Die resultierenden Lenkradwinkeltrajektorien für alle Übergabekon- 


zepte bei diesem Szenario sind in Abbildung 5.6 zu sehen. 


Da in diesem Szenario zu Beginn der Transitionsphase keine Stellgröße notwendig ist, wirkt 
sich das direkte Abschalten der Methode AF zu diesem Zeitpunkt nicht unmittelbar auf den 
Lenkradwinkel aus. Erst sobald sich die Referenz von der Ruhelage entfernt, muss ein Moment 
aufgebracht werden, um dieser zu folgen. Bis auf wenige Ausnahmen gelingt es den Versuchs- 
personen auch ohne Unterstützung, dem ab 3s nach der Übernahmeaufforderung ansteigen- 
den Sollwert unmittelbar nachzugehen. Die Trajektorien weisen jedoch eine deutlich größere 
Streuung um die Zielvorgabe auf als bei den anderen Konzepten, bei denen die Teilnehmer bei 
dem Manöver noch durch die Automation unterstützt werden. Da am Ende der Transitions- 
phase der Sollwert wieder bei 90° liegt, führt das sprunghafte Abschalten zu diesem Zeitpunkt 
bei der Methode AS zu einem vergleichbaren Einbruch des Lenkradwinkels wie im Szenario 
„Halten“. Ansonsten zeigen die Lenkradwinkeltrajektorien der Übergabekonzepte mit Unter- 
stützung bei Durchführung des Manövers einen qualitativ ähnlichen Verlauf. Unterschiede 
können jedoch bei Betrachtung der in Abbildung 5.7 dargestellten Momenttrajektorien der 


Automation gefunden werden. 
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(e) Graduelle Methode Differentialspiel (GD) 


Abbildung 5.5: Lenkmomentverläufe der Automation für alle Probanden im Szenario „Halten“, aufgeteilt nach Uber- 


gabemethode. Die Transitionsphase liegt im Intervall von 2 s bis 5 s nach dem Signal zur Übernahme. 
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Zeit nach Ubernahmeaufforderung in s 
(e) Graduelle Methode Differentialspiel (GD) 


Abbildung 5.6: Lenkradwinkelverläufe aller Probanden im Szenario „Anstieg“, aufgeteilt nach Ubergabemethode. 
Die Referenz (gestrichelte Linie) steigt im Szenario von 0° auf 90° an und die Transitionsphase liegt 
im Intervall von 2s bis 5s nach dem Signal zur Übernahme. 
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Zeit nach Ubernahmeaufforderung in s 
(e) Graduelle Methode Differentialspiel (GD) 


Abbildung 5.7: Lenkmomentverläufe der Automation für alle Probanden im Szenario „Anstieg“, aufgeteilt nach Uber- 
gabemethode. Die Transitionsphase liegt im Intervall von 2 s bis 5 s nach dem Signal zur Übernahme. 
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Die Ubergabemethode AS, bei der der Regler über die gesamte Transitionsphase aktiv bleibt, 
erzeugt mit über 2,5 Nm für alle Probanden das höchste Moment der Automation während des 
Transitionsprozesses. Zu Beginn ist der Verlauf des unterstützenden Moments vergleichbar mit 
dem der Variante GO, welche immer noch Werte über 2Nm erzielt. Durch die Reduktion des 
Transitionsparameters fällt der Maximalwert jedoch geringer aus. Außerdem wird bei GO in 
der zweiten Hälfte der Transitionsphase das Moment wieder verringert und nicht sprunghaft 
am Ende auf 0 Nm gesetzt wie bei AS. Die Trajektorien des Automationsmoments für die Me- 
thode GD zeigen einen analogen Verlauf, wobei das maximale Moment hier mehrheitlich unter 
2 Nm liegt. Mit Ausnahme der sofortabschaltenden Variante AF erzeugt die Übergabemetho- 
de GS die geringste Unterstützung, da durch die gleichmäßige Skalierung des Reglerausgangs 


bereits früher das Moment reduziert wird und so durchgehend unter 1,8 Nm bleibt. 


Statistischer Vergleich 


Um die Qualität der Übergabe quantitativ zu erfassen, wird für jeden Versuchsteilnehmer der 
mittlere absolute Lenkwinkelfehler während des Übergabezeitraums gemäß Gleichung (5.3) 
berechnet und mit Hilfe des einseitigen t-Tests für gepaarte Stichproben miteinander vergli- 
chen. Die exakten Werte von K; für die einzelnen Probanden in beiden Szenarien sind genauso 
wie eine vollständige Angabe aller p-Werte der durchgeführten t-Tests den entsprechenden 


Tabellen in Anhang A.1 zu entnehmen. 


Die mittleren Werte über alle Probanden sowie die p-Werte für die Paarungen, bei denen sich 
statistisch signifikante Unterschiede ergeben, sind für das „Halten“-Szenario in Abbildung 5.8 
dargestellt. Die mit Abstand höchste Abweichung ergibt sich in diesem Fall für das Konzept 
AF. Der Mittelwert von Kg über alle Probanden liegt mit 11,27° mehr als doppelt so hoch als 
der Wert für das Konzept GS, welches mit 5,13° den zweithöchsten Mittelwert aufweist. Es 
folgen die Konzepte AS und GO mit 4,80° bzw. 4,66°. Den kleinsten Fehler im Mittel erzeugt 
das differentialspielbasierte Übergabekonzept GD mit einem Wert von 4,31°. Die paarweisen 
statistischen Tests bestätigen den aus den Lenkradwinkeltrajektorien gewonnenen Eindruck, 
dass das frühe, abrupte Abschalten der Automation im Szenario „Halten“ im Mittel zu höheren 
Abweichungen von der Referenz führt als alle anderen Methoden zur Transition der Aufgabe. 
Mit p-Werten zwischen 0,0002 und 0,0004 ist der Unterschied zu den anderen Varianten statis- 
tisch hochsignifikant. Der Vergleich der graduellen Übergabekonzepte GS, GO und GD sowohl 
untereinander als auch mit der Variante AS, die die Automation am Ende der Transitionsphase 
abrupt abschaltet, ergibt, dass die Unterschiede in diesem Fall für das Szenario „Halten“ nicht 


statistisch signifikant sind. 


Bis auf den Tausch der Platzierung von AS und GS weisen die Übergabekonzepte für das Sze- 
nario „Anstieg“ dieselbe Reihenfolge auf (vgl. Abbildung 5.9). Die Mittelwerte von Kg über 
alle Probanden reichen von 1,66° für GD bis 3,30° für AS. Die Werte für die anderen Konzepte 
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Abbildung 5.8: Statistischer Vergleich des Lenkwinkelfehlers zwischen allen Übergabekonzepten für das Szenario 
„Halten“. Statistisch signifikante Unterschiede (*: p < 0.05) sind explizit angegeben. 


verteilen sich annähernd gleichmäßig dazwischen und betragen 2,63° (AS), 2,49° (GS) und 2,20° 
(GO). Durch die Identität von Solllenkradwinkel und Ruhelage des Systems zu Beginn des Sze- 
narios liegen die Mittelwerte in diesem Fall deutlich niedriger als im Szenario „Halten“. Relativ 
zueinander betrachtet unterscheiden sich die Methoden in diesem Szenario zum Teil dennoch 
voneinander. Dies zeigt sich anhand der Ergebnisse der paarweisen t-Tests. So ist zum einen 
die Reduktion des Lenkwinkelfehlers der Variante GO gegenüber beiden direkt-abschaltenden 
Übergabekonzepten statistisch signifikant (p = 0,0276 für den Vergleich mit AF, p = 0,0166 
für den Vergleich mit AS). Wird dagegen ein Differentialspiel zur Realisierung der graduellen 
Übergabe der Aufgabe verwendet, bestätigen die paarweisen t-Tests mit den anderen Metho- 
den sogar in allen Fällen einen signifikanten Unterschied. Die entsprechenden t-Tests liefen 
für den Vergleich von GD mit AF (p = 0,0039) und GO (p = 0,0027) ein sehr signifikantes und 
für den Vergleich mit AS (p < 0,0001) und GS (p < 0,0001) sogar ein hochsignifikantes Ergeb- 
nis. Anders als im Szenario „Halten“ ist die statistische Signifikanz der Verbesserung von AS 
und GS gegenüber AF hier nicht mehr gegeben. Alle anderen Kombinationen weisen ebenfalls 
keinen statistisch signifikanten Unterschied auf. 
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Abbildung 5.9: Statistischer Vergleich des Lenkwinkelfehlers zwischen allen Ubergabekonzepten fiir das Szenario 
„Anstieg“. Statistisch signifikante Unterschiede (*: p < 0.05) sind explizit angegeben. 


Auswertung der Fragen 


Neben den objektiven Bewertungskriterien wurden die Angaben der Probanden auf die Fragen 
nach ihrer Einschätzung der Leistung beim Folgen der Referenzlinie und ihrer Bewertung des 
Lenkgefühls während der Übergabe ausgewertet. Da die Probanden den Fragebogen erst am 
Ende eines Durchgangs ausgefüllt haben, wurde in der Frage nicht zwischen den Szenarien 
unterschieden. Die Abbildungen 5.10 und 5.11 zeigen den Durchschnitt und die Standardab- 
weichung der Bewertungen der getesteten Übergabekonzepte über alle Versuchsteilnehmer. 
Eine Tabelle mit den Einzelbewertungen befindet sich in Anhang A.1. 


Interessanterweise unterscheidet sich die Einschätzung der Probanden hinsichtlich der Frage, 
wie gut sie mit dem entsprechenden Konzept der Vorgabe folgen konnten, von den tatsächli- 
chen Ergebnissen. So wird das Konzept AF, welches keine Unterstützung während der Transi- 
tionsphase bietet und in beiden Testszenarien die höchsten mittleren absoluten Fehler produ- 
zierte, besser bewertet als die Methode AS, welche objektiv den mittleren bzw. vorletzten Platz 
belegt. AS erhält dagegen von den Versuchsteilnehmern die schlechteste Bewertung. Weiter- 
hin wird die Leistung bei Variante GO, die in beiden Szenarien zur zweitkleinsten Abweichung 
zur Referenz führt, schlechter bewertet als bei GS (viert- bzw. drittkleinste Abweichung) und 


landet so hinter GS auf dem dritten Rang. Einzig bei der am besten eingeschätzten Variante 
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Abbildung 5.10: Auswertung der Frage „Wie gut konnten Sie der vorgegebenen Linie während der Übergabe fol- 
gen?“, aufgeteilt nach Übergabemethode 


GD stimmen die Angaben der Probanden mit den Messungen überein. Insgesamt reicht die 
Einschätzung der Konzepte von knapp unter neutral bis knapp unter gut, wobei die Varian- 
ten bei denen das Automationsmoment sprunghaft reduziert wird, eher mit neutral und die 


graduellen Methoden eher mit gut beurteilt werden. 


Die Reihenfolge der Übergabekonzepte ist bei der Bewertung des Lenkgefühls identisch zu 
der Bewertung der Trajektorienfolgeleistung, jedoch erhöht sich der Abstand des am schlech- 
testen bewerteten Konzepts AS zu den anderen Methoden. Das abrupte Abschalten am Ende 
der Transitionsphase führt dazu, dass die Probanden das Lenkgefühl als unangenehm ange- 
ben. Das Abschalten zu Beginn der Transitionsphase wird dagegen mit neutral beurteilt, wobei 
dieser Vorgang im Szenario „Anstieg“ auch nicht spürbar ist, da zu Beginn der Phase ohne- 
hin kein Automationsmoment auf das Lenkrad aufgebracht wird. Eine graduelle Abnahme des 
Moments der Automation wird dagegen von den Versuchsteilnehmern als positiv wahrgenom- 
men und das Lenkgefühl mit 3,74 bis 4,06 von fünf Punkten auf der Bewertungsskala für all 
diese Methoden als angenehm empfunden. 


5.1.3 Interpretation und Zusammenfassung 


In diesem Experiment wurden fünf Übergabekonzepte in zwei Testszenarien anhand einer ein- 
fachen Trajektorienfolgeaufgabe miteinander verglichen. Die Auswertung der 35 Versuchsteil- 
nehmer zeigt, dass die frühestmögliche Abschaltung der Automation im Vergleich zu Metho- 
den, welche durch Reduktion eines Transitionsparameters innerhalb des Regelalgorithmus die 
Automation graduell abschalten, zu deutlich höheren Abständen zur Referenzvorgabe führt. 
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Abbildung 5.11: Auswertung der Frage „Wie empfanden Sie das Lenkgefühl während des Übergabevorgangs?“, auf- 
geteilt nach Übergabemethode 


Die Unterschiede sind hierbei statistisch signifikant (Vergleich mit Methode GO im Szenario 
„Anstieg“) bzw. hochsignifikant (Vergleich mit Methode GO im Szenario „Halten“ und mit Me- 
thode GD in beiden Szenarien). Ist am Ende der Präparationsphase unmittelbar ein Lenkmo- 
ment nötig, um der Referenz zu folgen, liefern sogar alle Varianten, die den Fahrer in der Tran- 
sitionsphase noch durch ein Moment der Automation unterstützen, einen geringeren Fehler 
als ein sofortiger Wechsel zur rein manuellen Kontrolle (Unterschied jeweils hochsignifikant). 
Für diese Varianten untereinander kann hingegen kein signifikanter Unterschied festgestellt 
werden. Die niedrigste Abweichung zum Sollwert liefert für beide Testszenarien die Umset- 
zung der Übergabe mit Hilfe eines Differentialspiels gemäß der Beschreibung aus Abschnitt 
3.3. Die Verbesserung durch dieses Konzept ist im Falle des Szenarios „Anstieg“ statistisch 
hochsignifikant gegenüber allen getesteten Alternativen. 


Um die Frage zu klären, warum dieses Konzept bessere Ergebnisse liefert, müssen die Automa- 
tionsmomente der verschiedenen Methoden betrachtet werden. Der Vergleich der Trajektori- 
en zeigt in beiden Szenarien, dass die Methoden GO und GD zu Beginn der Transitionsphase 
einen annähernd identischen Verlauf zu den Trajektorie bei AS aufweisen. Das ist gleichbe- 
deutend mit der Beibehaltung des Automatisierungsgrads, der vor der Übernahmeaufforde- 
rung vorliegt. Die Konzepte AF und GS erfordern dagegen durch sofortiges Abschalten bzw. 
eine stärkere Reduktion der Unterstützung von Beginn an eine Reaktion des übernehmenden 
Menschen ein. In der zweiten Hälfte der Transitionsphase ist zu erkennen, dass das unterstüt- 
zende Moment bei Methode GD früher reduziert wird bzw. nicht so hoch ansteigt wie bei GO 
und AS, bei denen das Moment erst sehr spät und damit verbunden auch deutlich steiler bzw. 


sogar sprunghaft abfällt. In der Transitionsphase muss also ein Kompromiss zwischen der Her- 
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anführung des Ubernehmenden an die neue Tätigkeit und einer rechtzeitigen Vorbereitung der 
vollstandigen Ubergabe der Kontrolle gefunden werden. Die Ergebnisse des Experiments indi- 
zieren, dass für einen guten Erfüllungsgrad der Aufgabe der menschliche Partner zunächst mit 
voller Unterstützung an die Aufgabe herangeführt, das assistierende Moment jedoch anschlie- 
Bend besser früher und dafür über einen längeren Zeitraum allmählich reduziert werden sollte. 
Das differentialspielbasierte Übergabekonzept modelliert diese Anforderung gut und führt so- 


mit zu den besten Ergebnissen. 


Es ist anzumerken, dass es durch Anpassung des Skalierungsparameters « bzw. des Transiti- 
onsparameters a auch möglich wäre, den Verlauf des Automationsmoments der Übergabeme- 
thoden GS und GO so zu gestalten, dass dieser identisch zum Verlauf für das Konzept GD bei 
gegebener Parametrierung ist. Den zusätzlichen Aufwand, einen solchen Verlauf zu ermitteln, 
kann jedoch durch die Modellierung der Interaktion zwischen Automation mit Hilfe eines 
Differentialspiels eingespart werden, da dieses Konzept inhärent den Kompromiss zwischen 
Ausführung der Aufgabe und Abgabe derselben an den menschlichen Partner sucht. Dabei 
ermöglicht diese Modellierung zusätzlich eine leichtverständliche Interpretierbarkeit des Ver- 
laufs des verwendeten Transitionsparameters als aktuelle Aufteilung der Aufgabe zwischen 


den Partnern. 


Die Befragung der Versuchsteilnehmer zeigt, dass die verbesserte Leistung beim Folgen der 
Referenz im Falle der differentialspielbasierten Übergabe auch korrekt wahrgenommen wird 
und dieses Konzept den höchsten Wert erreicht. Zudem wird das Konzept auch in der Kate- 
gorie Lenkgefühl am besten bewertet. Auch in der subjektiven Wahrnehmung der Probanden 
scheint das Übergabekonzept GD folglich den Zielkonflikt zwischen Unterstützung und Ab- 
gabe der Aufgabe am besten zu lösen. Die graduellen Übergabekonzepte erzielen jedoch auch 
generell bessere Benotungen als die direkt abschaltenden Konzepte. Insbesondere das Lenkge- 
fühl wird bei den Methoden mit abrupter Abschaltung kritisch betrachtet, was potenziell an 
der als unkomfortabel empfundenen, großen Änderung des haptisch wahrgenommenen Mo- 
ments liegt. Das späte Abschalten erhält hierbei nochmal erheblich schlechtere Bewertungen 
als das frühe Abschalten. Ein Erklärungsansatz hierfür lautet, dass der Momentensprung bei 
frühestmöglichem Abschalten im Szenario „Anstieg“ überhaupt nicht auftritt oder im Testsze- 
nario „Halten“ von einem Teil der Probanden zumindest nicht wahrgenommen wird, da sie 
zu diesem Zeitpunkt die Hände noch nicht am Bedienelement haben. Die identische Rangfol- 
ge der Konzepte in der Bewertung der Fähigkeit, der Spur zu folgen, deutet auf eine falsche 
Einschätzung der Probanden hin, dass eine unkomfortable Übergabe auch eine schlechtere 
Leistung beim Nachfahren der Solltrajektorie zur Folge haben muss. Hohe Abweichungen zu 
Beginn der Transition, wie sie in den Konzepten AF und GS entstehen, könnten in der stres- 
sigen Übernahmesituation weniger bewusst wahrgenommen werden als Abweichungen am 


Ende, wenn der Versuchsteilnehmer wieder voll auf die Lenkaufgabe fokussiert ist. 
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Das Experiment zeigt zudem, dass eine a-priori und für alle Versuchspersonen identische Fest- 
legung des Startzeitpunkts der Transition nicht praxistauglich ist. Der vordefinierte Übergang 
von Präparations- zu Transitionsphase exakt 2s nach der Übernahmeaufforderung führt zum 
einen dazu, dass Probanden, die bereits früher übernahmebereit waren, noch die volle Un- 
terstützung erhalten, obwohl die Transition prinzipiell schon beginnen könnte. Zum anderen 
beginnt die Transitionsphase für einige Versuchspersonen ungeachtet der Tatsache, dass diese 
sich noch nicht von der Nebenaufgabe abgewandt und die Hände an das Lenkrad genommen 
haben. Die Auswirkungen dieser offensichtlich zu früh startenden Transition sind deutlich im 
Szenario „Halten“ zu erkennen. Hier muss die Reduktion des Moments der Automation unmit- 
telbar durch den Menschen kompensiert werden, was besonders bei einem schnellen Abfall zu 
hohen Abweichungen vom Sollverlauf führt, wenn der Proband dazu noch nicht in der Lage 
ist. Aus diesem Grund sollte beim Design von Transitionen darauf geachtet werden, dass die 
Aufgabe frühestens dann an den Menschen übergeben wird, wenn dieser physisch dazu bereit 
ist. Mit Hilfe von Sensoren, welche zur Laufzeit erkennen, ob die Versuchsperson bereits die 
Hände am Lenkrad hat, könnte das Ende der Präparationsphase exakt bestimmt werden. Eine 
entsprechende Sensorik am Bedienelement wurde deshalb für die nachfolgenden Experimente 


eingesetzt, um den Startzeitpunkt der Transition korrekt zu wählen. 


Insgesamt zeigt das Experiment bereits bei dem sehr einfachen Versuchsaufbau sowohl in 
den objektiven wie auch den subjektiven Bewertungskriterien die Vorteile von haptischer 
Unterstützung während der Übergabe. Insbesondere die Modellierung der Mensch-Maschine- 
Interaktion mit Hilfe eines zeitvarianten Differentialspiels liefert vielversprechende Ergebnis- 
se. Daher sollte geprüft werden, ob sich dieser Ansatz auf komplexere Aufgaben, wie z.B. die 
Übernahme eines Fahrzeugs nach einer hochautomatisierten Fahrt, übertragen lässt und sich 
die Vorteile auch hierfür bestätigen lassen. Um diese Fragestellung zu untersuchen, wurde das 


nachfolgende Experiment konzipiert. 


5.2 Vergleich von direkter und kooperativer Übergabe der 
Fahrzeugquerführung 


Nachdem das erste Experiment gezeigt hat, dass eine differentialspielbasierte Modellierung 
der Interaktion zwischen den Kooperationspartnern eine performante und komfortable Über- 
gabe einer einfachen Aufgabe von der Automation an den Menschen ermöglicht, wird dieses 
Konzept in einem zweiten Experiment auf die deutlich anspruchsvollere Aufgabe der Fahr- 
zeugquerführung übertragen. Das Experiment soll die kritische Situation abbilden, in der ein 
auf eine fahrfremde Tätigkeit fokusierter Fahrer eines hochautomatisiert fahrenden Fahrzeugs 


an einer Systemgrenze zur Fahrzeugübernahme aufgefordert wird und anschließend schnell 
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und sicher reagieren muss, um eine Kollision zu vermeiden. Basierend auf den Messungen die- 
ses Experiments wird analysiert, ob und ggf. in welchem Umfang eine kooperative Übergabe 
im Vergleich zum konventionellen, direkten Abschalten der Automation auch hier Verbesse- 


rungen erzielen kann. 


5.2.1 Versuchsbeschreibung 


Da die Konzepte in einer kritischen Fahrsituation miteinander verglichen werden sollen, je- 
doch eine Gefährdung der Versuchsteilnehmer und ggf. weiterer Personen ausgeschlossen 
werden müssen, kann das Experiment nicht im öffentlichen Straßenverkehr stattfinden. Eine 
Versuchsdurchführung auf einem Testgelände vermittelt den Probanden zwar ein realistisches 
Fahrgefühl, ein immersives Bild eines realitätsnahen Übergabeszenarios nach einer längeren 
hochautomatisierten Fahrt ist dort jedoch nur mit erheblichem zeitlichen und finanziellen Auf- 
wand umsetzbar. Aus diesen Gründen wurde ein Fahrsimulator als Plattform für dieses Expe- 
riment gewählt, welcher reproduzierbar authentische Szenarien vermitteln kann und dabei die 
Sicherheit der Versuchspersonen gewährleistet. Die Vorstellung des Experiments erfolgt an- 
hand der Elemente Versuchsaufbau, Regelalgorithmus, Fahrszenario, Übergabekonfiguratio- 
nen, Versuchsablauf und Bewertungskriterien, die nachfolgend einzeln im Detail beschrieben 


werden. 


Versuchsaufbau 


Als Versuchsstand für das Experiment wurde der in Abbildung 5.12 dargestellte, statische Fahr- 
simulator des Lehrstuhls für Ergonomie (LfE) an der Technischen Universität München ge- 
nutzt. Kern des Simulators ist eine Karosserie der 6er Reihe des Herstellers BMW. Hierdurch 
entsprechen das Interieur, die Möglichkeiten der Umgebungswahrnehmung und die räumli- 
chen Verhältnisse innerhalb der Fahrgastzelle denen einer realen Fahrt in einem solchen Fahr- 
zeug. Der Fahrzeuginnenraum unterscheidet sich vom Serienfahrzeug durch den Einbau von 
zwei frei programmierbaren Displays, welche die Rolle von Kombiinstrument und zentralem 
Infotainment-Display übernehmen sowie der Installation von drei Infrarotkameras zur Fahr- 
erbeobachtung mit Hilfe eines SmartEye Eye-Tracking-Systems. Analog zum ersten Experi- 
ment wird auch in diesem Versuchsaufbau der Aktor eines SensoWheel SD-LC verwendet, um 
sowohl ein realistisches Lenkgefühl zu erzeugen als auch die Lenkmomente der Automation 
bereit zu stellen. Für die Detektion der Hände des Fahrers wird die im Originallenkrad verbau- 
te Sensorik genutzt. Die Darstellung der Fahrzeugumgebung erfolgt mit Hilfe eines aus sechs 
Projektoren bestehenden Projektionssystems. Drei Projektoren bilden die Frontsicht, indem 
sie jeweils einen Teil der 26 m? großen, polygonförmigen Leinwand beleuchten und so ein 
Sichtfeld von ca. 180° aus Sicht der Fahrerperspektive erlauben. Die übrigen Projektoren er- 


zeugen jeweils auf drei getrennten Leinwänden die Sicht nach hinten, die vom Fahrersitz über 
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die beiden Seiten- und den Innenspiegel eingesehen werden kann. Abbildung 5.13 zeigt den 
schematischen Aufbau des Projektionssystems. 


Abbildung 5.12: Statischer Fahrsimulator des Lehrstuhls für Ergonomie an der Technischen Universität München 
©TUM 
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Abbildung 5.13: Projektionssystem des Fahrsimulators ©TUM 
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BITTE UBERNEHMEN 


(a) Zustände der Automation: (b) Ubernahmeaufforderung 
Inaktiv-nicht verfügbar, inaktiv-verfügbar, aktiv 


Abbildung 5.14: Icons zur Anzeige des Zustands der Automation und der Übergabeaufforderung 


Die Berechnung der Fahrzeugdynamik, der Visualisierung, des 3-D-Sounds und der Daten- 
verarbeitung erfolgt mit der Fahrsimulationssoftware SILAB Version 5.0 auf einem aus elf 
Rechnern bestehenden Netzwerk. Einzig der Querführungsregler für die kooperative Über- 
gabe wird auf einem separaten PC in MATLAB Simulink Version R2016a berechnet, der für 


den Datenaustausch via UDP an das Netzwerk angebunden ist. 


Die hochautomatisierte Fahrfunktion kann über eine Taste am Lenkrad aktiviert werden, falls 
sich das Fahrzeug in einem Bereich befindet, in dem eine Nutzung zulässig ist. Der aktuelle 
Systemzustand (Inaktiv-nicht Verfügbar, Inaktiv-Verfügbar, Aktiv) wird auf dem Kombiinstru- 
ment angezeigt. Eine Aufforderung des Systems an den Fahrer, die Fahrzeugführung zu über- 
nehmen, erfolgt gemäß den Richtlinien aus [CRBM07] einerseits akustisch über einen wieder- 
holten Piepton (70 dB, 2600 Hz), andererseits über ein weiteres Symbol im Kombiinstrument. 
Die visuelle Komponente des Human-Machine-Interfaces (HMI) ist der Masterarbeit [Fis16] 
entnommen und die entsprechenden Icons zur Anzeige des Systemzustands sowie der Über- 
nahmeaufforderung sind in Abbildung 5.14 wiedergegeben. 


Um auch das angestrebte Nutzungsverhalten realistisch abzubilden, wird eine Aufgabe bereit- 
gestellt, mit der sich die Probanden während der hochautomatisierten Fahrt beschäftigen und 
so vom Fahrgeschehen abgelenkt werden sollen. Hierfür wurde der Surrogate Reference Task 
(SuRT) [ISO12] gewählt, bei dem aus einer Menge von kleinen Kreisen der Kreis gefunden 
werden muss, der etwas größer als die Übrigen ist. Die Aufgabe wurde auf einem separaten 
Tablet angezeigt, welches die Probanden während der Erledigung in den Händen halten konn- 
ten. Der SuRT ist so realisiert, dass mit einer Wischbewegung zunächst die Seite, in der sich 
der größere Kreis befindet, ausgewählt und die Auswahl anschließend mit einem Tippen be- 
stätigt werden muss. Daraufhin beginnt der nächste Durchgang mit einer neuen Anordnung 
der Kreise. Die Versuchspersonen werden hierdurch also visuell, motorisch und kognitiv be- 
ansprucht. Dies ist vergleichbar mit der Nutzung von mobilen Endgeräten, was einen realisti- 


schen Anwendungsfall für die Verwendung einer hochautomatisierten Fahrfunktion darstellt. 


5.2 Vergleich von direkter und kooperativer Übergabe der Fahrzeugquerführung 87 


Abbildung 5.15 zeigt einen Screenshot der SuRT-App, bei dem bereits eine Auswahl für die 
rechte Bildschirmseite getroffen wurde, die Bestätigung aber noch aussteht. 


Abbildung 5.15: Screenshot der SuRT-App, bei der aktuell die rechte Seite vorausgewählt wurde (Hintergrund ändert 
sich von schwarz zu grau); der größere Kreis befindet sich oben rechts 


Verwendeter Regelalgorithmus 


Der Querführungsregler wurde auf Basis des Hamilton-Ansatzes, wie in Abschnitt 3.2.1 vorge- 
stellt, programmiert”. Zur Modellierung des Einflusses des Lenkradwinkels auf die Fahrzeug- 
bewegung wird das, bereits 1940 erstmalig veröffentlichte, lineare Einspurmodell verwendet 
[RS40]. Die bis heute hohe Relevanz und weite Verbreitung dieses Modells zeigt sich durch die 
Erläuterung in der Fahrdynamik-Literatur, wie beispielsweise in [MW 13], [KN05] oder [EG17], 
auf die auch für die Herleitung der Gleichungen verwiesen wird. In [Tra12] wird gezeigt, dass 
die Modellgenauigkeit für ein Szenario, wie es hier verwendet wird, ausreicht und die Ver- 
besserung durch komplexere Modelle, wie das nichtlineare Einspurmodell und das Zweispur- 
modell, die daraus resultierende Erhöhung der Berechnungszeit für diese Anwendung nicht 
rechtfertigen. 


Die folgende Systemgleichung beschreibt den resultierenden Zusammenhang zwischen den 
Systemzuständen Schwimmwinkel ß und Gierrate , und dem Lenkradwinkel ô in Abhängig- 
keit von der Fahrzeugmasse m, der Geschwindigkeit v, der Lenkübersetzung ij, dem Träg- 
heitsmoment des Fahrzeugs um die Hochachse Ir, den Schräglaufsteifigkeiten vorne Cy und 
hinten C, sowie den Abständen der Achsen zum Schwerpunkt I, bzw. lp: 


5 Alternativ, jedoch mit höherem Rechenaufwand, kann der Querführungsregler auch über den Batch-Ansatz (vgl. 


Abschnitt 3.2.2) realisiert werden, was in der Bachelorarbeit [Ott18] umgesetzt wurde. 
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B -Cy-Ch CHhhh-Coly-mv? B on 
= mv É mvi, 
ý Ci Ch, CC, È m + | Colo (5.6) 
I IFv Fi 


Unter der Annahme kleiner Winkel ergibt sich zudem die Änderung der Position y entlang 


der Fahrzeugquerachse aus 
y= vp + vý. (5.7) 


Zur Veranschaulichung sind die geometrischen Zusammenhänge in Abbildung 5.16 skizziert. 


Bezugskoordinatensystem 


Abbildung 5.16: Geometrische Zusammenhänge des linearen Einspurmodells 


Die Dynamik des Lenkstrangs wird hier wie im ersten Experiment durch eine lineare Feder 
und einen linearen Dämpfer modelliert, sodass für ein Lenksystem mit Trägheitsmoment I, 
Dämpfung d und Steifigkeit c analog zu Gleichung (5.1) der Zusammenhang zwischen dem 
Lenkradwinkel ô und den Lenkmomenten der Automation ua sowie des Menschen uy durch 


das Zustandsraummodell 


uM (5.8) 


beschrieben werden kann. 
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Ergänzt um den Gierwinkel y als weiterer Zustand lassen sich die Gleichungen (5.6), (5.7) 


und (5.8) zu einem einzigen Zustandsraummodell mit den Lenkmomenten als Eingangsgrößen 


zusammenfassen: 

B -Cv-Ch Crha me” -Cols 0 0 & o lfs 0 0 
mv mv MUis 

ý Crh -Cvl ehh 0 0 Cola 0 ý 0 0 
F FU Fls 

0 0 

v| _ 0 1 000 off¥|, o fua +] 0 fum (5.9) 

y v 0 v 0 0 0 1|¥ 

5 0 0 00 o 11 4 g 

ô -=c -d| | ô = a 
0 0 0 0 E T L L 


Dieses Modell wird als Nebenbedingungsgleichung (3.58c) der Optimierung verwendet. 


Neben dem Systemmodell benötigt der Regler zudem eine Referenztrajektorie X. Eine Metho- 
de zur Generierung dieser Sollwerttrajektorie wurde im Rahmen der Bachelorarbeit [Sch17] 
umgesetzt und soll hier kurz vorgestellt werden. Grundlage der Trajektorie bildet der Verlauf 
der Straße, dessen Koordinaten aus der Fahrsimulationssoftware ausgelesen werden können. 
Uber eine Verschiebung der Straßenverlaufstrajektorie senkrecht zur Fahrbahn kann die Spur 
ausgewählt werden, auf der das Fahrzeug fahren soll. Ein Spurwechsel kann mit Hilfe eines 
Triggersignals eingeleitet werden, beispielsweise um ein vorausfahrendes Fahrzeug zu über- 
holen. Dafür wird die Trajektorie entlang der Straße mit Hilfe einer Sigmoidfunktion entspre- 
chend der Methode aus [Stä08] modifiziert und nach Abschluss des Spurwechsels der Offset 
der Straßenverlaufstrajektorie an die neue Spur angepasst. Da Gleichung (5.9) die Bewegung 
im lokalen Fahrzeugkoordinatensystem beschreibt, wird die ggf. modifizierte Trajektorie an- 
schließend vom globalen in dieses lokale Koordinatensystem transformiert und kann so in 
Form von Referenzwerten in y und y angegeben werden. Im letzten Schritt wird die orts- 
abhängige Solltrajektorie auf Basis der aktuellen Fahrzeuggeschwindigkeit entsprechend der 
Diskretisierungszeit des Reglers abgetastet und ggf. interpoliert, wodurch man die erforderli- 


che, zeitabhängige Darstellung von X erhält. 


Die Parametrierung des Reglers ergibt sich wie folgt. Die Einspurmodellparameter iz, lv, lp, m 
und Ir können direkt aus den Fahrzeugdaten der Simulationssoftware abgelesen werden, wäh- 
rend die Schräglaufsteifigkeiten C, und C} experimentell mit der Methode aus [Tad12] be- 
stimmt werden. Die Wahl der Modellparameter der Lenkung verläuft analog zum ersten Ex- 
periment (vgl. Abschnitt 5.1.1). Die Gütemaße der beiden Spieler (3.58a) bzw. (3.58b) werden 
hinsichtlich R normiert. Für die Bestimmung des optimalen Lenkmoments werden nur der 
Gierwinkel y, die Gierrate und die Querposition y berücksichtigt, weshalb die Zustands- 
gewichtungsmatrix der Gütemaße zu Q* = diag(0, lj» qy» Ty: 9, 0, 0) gewahlt wird. Die Matrix 
zur Bestrafung des Endzustands S* wird identisch zu Q* parametriert. Die verwendeten Zah- 


lenwerte für alle Modell- und Gütemaßparameter sind Tabelle 5.2 zu entnehmen. 
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Tabelle 5.2: Gütemaß- und Modellparameter für das Experiment zum Vergleich von direkter und kooperativer Uber- 
gabe der Fahrzeugquerführung 


Parameter Wert Einheit 
IL 0,09 Nm s?/rad 
c 1,15 Nm/rad 
d 0,29 Nm s/rad 

iL 17,7 7 

lo 1,418 m 

ln 1,412 m 
Cy 90000 N/rad 
Ch, 160000 N/rad 
m 1835 kg 
Ip 2100  Nms?/rad 
qj 40 s?/rad? 
qy 70 1 /rad? 
qy 4 1/m? 
R 1 1/N? 


Die Optimierung erfolgt über einen gleitenden Horizont der Länge 1,5 s. Zu Beginn jedes Opti- 
mierungsdurchgangs werden die Soll- und Ist-Zustände in das lokale Koordinatensystem mit 
dem Ursprung im Fahrzeugschwerpunkt und den Achsen entlang bzw. senkrecht zur Fahr- 
zeuglängsachse transformiert, um die Gültigkeit der linearen Beschreibung der Fahrzeugkine- 
matik zu bewahren. Die Diskretisierungszeit für die numerische Lösung des Differentialglei- 
chungssystems (4.8) wird identisch zur Abtastzeit der Fahrsimulation zu 16 ms gewählt. Der 
Betrag der so berechneten Stellgröße der Automation wird abschließend auf 2Nm begrenzt, 
bevor es als Sollmoment an den Aktor kommuniziert wird. Dies stellt sicher, dass der Eingriff 


der Automation stets von den Versuchspersonen übersteuert werden kann. 


Eine am LfE programmierte Längsregelung vervollständigt die hochautomatisierte Fahrfunk- 
tion. Mit Hilfe eines PID-Reglers wird ein Adaptive Cruise Control System nachgebildet. Wird 
kein Objekt vor dem Fahrzeug erkannt, regelt das System auf die zulässige Sollgeschwindig- 
keit, andernfalls auf die Geschwindigkeit, für die eine konstante Zeitlücke von 2 s bis zur Kol- 
lision mit dem vorausfahrenden Fahrzeug besteht. Mit den damit zur Verfügung stehenden 
Längs- und Querregelungen sind die Voraussetzungen für eine Fahrfunktion geschaffen, die 


hochautomatisiertes Fahren ermöglicht. 


Fahrszenario 


Der Vergleich von Übernahmesituationen bei einem Fahrzeug mit und ohne kooperativen 


Transitionsprozess ist Teil eines größeren Experiments im Rahmen des vom Bundesministe- 
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rium für Bildung und Forschung geförderten Projekts „Personalisierte, adaptive, kooperative 
Systeme für automatisierte Fahrzeuge“ (PAKoS)°. Innerhalb des Gesamtexperiments werden 
drei wesentliche Komponenten der Nutzung einer hochautomatisierten Fahrfunktion nachge- 


bildet: 
e Erstes Einschalten der Funktion 
e Freiwillige Übernahme der Fahraufgabe durch den Fahrer 
e Übernahme der Fahraufgabe nach Aufforderung durch das System 


Da hiervon nur der letzte Punkt Gegenstand dieser Dissertation ist, wird nachfolgend zwar 
der Ablauf des gesamten Experiments vorgestellt, die Ergebnisse zu den ersten beiden Kom- 


ponenten jedoch in dieser Arbeit nicht weiter ausgewertet und analysiert. 


Die Komponenten wurden in ein entsprechendes Streckenszenario eingebettet, welches je- 
weils mit unterschiedlichen Konfigurationen wiederholt wurde. Abbildung 5.17 veranschau- 
licht den Streckenaufbau grafisch. 


Autobahn- Teil- Erweiterung auf Abschnitt mit : Abschnitt mit Rastplatz 
auffahrt stück | drei Spuren : LKW : Übergabe : 
625m 1km _; 186m ; 10 km ; 6km : _750m 
; : ; ; 
I i . 
1 1 : 
ee a =, = >* 
1 ; i Pannen- 
! : iM fe hrzeug) 
l 2 l A 
ee a ete Goleta 
i langsamer i 
: LKW 1 
© 1 


Automation : : Übernahme- 
verfügbar aufforderung 


Landstraße 
1km 


Stadtgebiet 
202 m 


BE Startpunkt 
Abbildung 5.17: Schematische Darstellung der Abfolge der Streckenkomponenten 


Das Szenario beginnt immer in einer Stadtumgebung und führt nach 202 m auf eine 1 km lange 
zweispurige Landstraße. Am Ende dieser Straße folgt eine Auffahrt auf eine Autobahn (Länge 
der Auffahrt 625 m, länge des Autobahnteilstücks 1 km) mit zwei Spuren pro Fahrtrichtung. 


Die Breite jeder Spur der Autobahn beträgt im gesamten Szenario 4m, die Schutzplanken 


6 Für detaillierte Infomationen zum Gesamtprojekt siehe www.technik-zum-menschen-bringen.de/projekte/pakos 


92 5 Experimentelle Validierung 


sind 0,5m von den äußeren Fahrspuren entfernt. Außerdem beträgt die Geschwindigkeits- 
begrenzung durchgehend 120 km/h. Im nächsten Abschnitt der Lange 186 m erweitert sich die 
Fahrbahn auf drei Spuren. Damit beginnt ein 10km langes Autobahnteilstück, auf dem die 
hochautomatisierte Fahrfunktion verfügbar ist. Die Funktion lässt sich nur auf dem rechten 
Fahrstreifen aktivieren, nutzt im Anschluss daran jedoch abhängig von der Verkehrssituation 
alle Fahrbahnen. Die Probanden sollen die Funktion in diesem Bereich selbstständig einschal- 
ten bzw. werden spätestens nach zwei Minuten vom Versuchsleiter dazu aufgefordert. Auf 
diesem Abschnitt befindet sich nach 3km ein LKW auf der rechten Spur. Aufgrund der ho- 
hen Verkehrsdichte auf der Mittelspur initiiert die Automation keinen Spurwechsel, sondern 
folgt dem LKW mit der reduzierten Geschwindigkeit von 80 km/h. Hier sollen die Probanden 
von sich aus die Fahraufgabe übernehmen und den Spurwechsel selbst durchführen. Auch 
hier erfolgt nach zwei Minuten eine Aufforderung durch den Versuchsleiter, falls die Proban- 
den nicht wie gewünscht reagieren, um den geplanten Ablauf für die verbleibende Strecke zu 
garantieren. Ebenso werden die Probanden im Anschluss zur erneuten Aktivierung der hoch- 
automatisierten Fahrfunktion aufgerufen, falls sie das nicht selbstständig tun. Als nächstes 
folgt das Teilstück mit der Übernahmeaufforderung (Länge 6 km). Da dies der für diese Arbeit 
relevante Streckenabschnitt ist, erfolgt die Beschreibung hier ausführlicher als für die anderen 


Bereiche. 


Auf den ersten 5 km führt die Automation selbstständig mehrere Spurwechsel zwischen allen 
drei Fahrspuren durch, um andere Verkehrsteilnehmer zu überholen. Am Ende dieser Passa- 
ge befindet sich das Fahrzeug auf der mittleren Spur eines geraden Streckenstücks, wobei die 
rechte Spur in diesem Bereich durch andere Verkehrsteilnehmer oder Objekte blockiert ist. Zu- 
dem ist die Sicht nach vorne durch ein vorausfahrendes Fahrzeug eingeschränkt, sodass das 
stehende Pannenfahrzeug der Breite 1,957 m, dessen Mittelpunkt sich 450 m entfernt ebenfalls 
auf der Mittelspur befindet, verdeckt ist. Kurz darauf weicht das vorausfahrende Fahrzeug 
diesem Hindernis aus und gibt damit die Sicht auf das stehende Fahrzeug frei. Sobald sich 
das zuvor verdeckende Fahrzeug auf der linken Spur befindet, fordert das System den Fahrer 
zur Übernahme der Fahrzeugführung auf. Der Mittelpunkt des Ego-Fahrzeugs befindet sich 
zu diesem Zeitpunkt 200m vom Hindernis entfernt auf der Position 5250 m des Teilstücks. 
Im Falle der Beibehaltung der Ausgangsgeschwindigkeit von 120 km/h ergibt sich somit un- 
ter Berücksichtigung der räumlichen Ausdehnung der Fahrzeuge eine Zeitdauer von 5,86 s, 
bis das eigene Fahrzeug auf das Pannenfahrzeug auffahren würde. Die tatsächliche Zeitdauer 
wird jedoch durch das Ausrollen des Fahrzeugs sowie ggf. weitere Bremseingriffe durch die 
Versuchsperson erhöht. Abbildung 5.18 zeigt die geometrischen Verhältnisse zum Zeitpunkt 


der Übernahmeaufforderung für ein beispielhaftes Übergabeszenario. 


Nach dem Übernahmeszenario steht die Automationsfunktion nicht mehr zur Verfügung. Die 
Probanden werden nach dem entsprechenden Teilstück über Verkehrsschilder dazu angehal- 
ten, am folgenden Rastplatz, der weitere 750 m entfernt ist, die Autobahn zu verlassen. Mit 


dem Anhalten auf diesem Rastplatz endet die Fahrt. Die Strecke besitzt somit eine Gesamtlän- 
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Abbildung 5.18: Umgebungssituation zum Zeitpunkt der Übernahmeaufforderung. Ein Pannenfahrzeug steht 200 m 
entfernt auf der mittleren Spur. Die rechte Spur ist in diesem Fall durch LKWs blockiert. 


ge von knapp 20 km und man benötigt je nach Fahrstil bzw. Zeit, welche die Probanden hinter 
dem LKW verbleiben, 10 -15 min, um das gesamte Szenario von der Stadt bis zum Rastplatz 


zu absolvieren. 


Übergabekonfigurationen 
Als unabhängige Variable des Experiments wird die Konfiguration der Transition während des 
Übernahmeszenarios verwendet. Die nachfolgenden drei Konfigurationen werden getestet: 

e Direkte Übergabe 

« Kooperative Übergabe 


e Kooperative Übergabe mit personalisiertem HMI 
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Bei der direkten Ubergabe erfolgt die Abschaltung des Querreglers zeitgleich mit der Ubernah- 
meaufforderung. Da die Aufforderung jedoch auf einem geraden Fahrbahnabschnitt erfolgt, 


halt das Fahrzeug die Spur, bis der Proband ein Lenkmanöver vornimmt. 


Die kooperative Übergabe verläuft dagegen analog zum differentialspielbasierten Konzept aus 
dem ersten Experiment (vgl. Abschnitt 5.1.1). Das bedeutet die Funktion bleibt während der 
Präparationsphase aktiv. Sobald die Hände zuverlässig am Lenkrad detektiert werden, beginnt 
die Transitionsphase, deren Länge zu 4s gewählt wurde. Auch hier verbleibt der Transitions- 
parameter für die Dauer eines Prädiktionshorizonts auf dem Wert 1 und wird anschließend 
über die verbleibende Zeit linear auf 0 reduziert. In der dritten Variante wird den Probanden 
statt den Anzeigen aus Abbildung 5.14 personalisierte Symbole zur Verfügung gestellt. Wei- 
terhin erhalten sie mit der Sprachansage „Wenn möglich, links ausweichen!“ eine Handlungs- 
empfehlung. Für die Personalisierung des HMIs werden die Versuchspersonen vorab anhand 
eines Fragebogens klassifiziert und ihnen ein entsprechendes Anzeigekonzept dargeboten. Da 
sich das Konzept von der regelungstechnischen Umsetzung nicht von der Variante mit dem 
im vorherigen Unterabschnitt vorgestellten HMI unterscheidet, wird in dieser Arbeit auf diese 
Konfiguration nicht weiter eingegangen und nur die direkte mit der kooperativen Transition 
verglichen. Die Längsregelung schaltet in allen Varianten mit der Übernahmeaufforderung ab 


und das Fahrzeug rollt aus. 


Versuchsdurchführung 


Die Durchführung des Versuchs erfolgte im Rahmen der Masterarbeit [Kus19]. Das komplet- 
te Szenario wurde von jedem Probanden in jeder Übergabekonfiguration einmal durchlaufen. 
Vor Beginn der drei Versuchsdurchgänge wurden die Probanden über den Versuchsablauf in- 
formiert. Sie wurden angehalten, sich möglichst identisch zu einer realen Fahrt zu verhalten 
und auf die Einhaltung der Straßenverkehrsordnung hingewiesen. Weiterhin wurden sie dar- 
über aufgeklärt, dass sie nach der Übernahmeaufforderung der einzig verantwortliche Fah- 
rer sind, das System jedoch versucht, sofern möglich, unterstützend einzugreifen. Zusätzlich 
wurden die Versuchspersonen gebeten, die Nebenaufgabe zu erfüllen, wenn die Situation es 
zulässt, d.h. nur wenn die Automation aktiv ist. Nachdem geprüft wurde, ob die Teilnehmer 
die wichtigsten Aussagen wiedergeben konnten, hatten sie die Gelegenheit den Fahrsimulator 
im Rahmen einer Eingewöhnungsfahrt kennenzulernen. Hierbei konnten sie Sitz- und Spie- 
gelposition passend einstellen, die Reaktion des Fahrzeugs auf Lenk-, Beschleunigungs- und 
Verzögerungseingaben testen und sich mit der Bedienung der Automation vertraut machen. 
Außerdem wurde auf einem geraden Streckenabschnitt der Ablauf einer Übernahmeaufforde- 


rung demonstriert, die jedoch keinen aus der Fahrsituation erkenntlichen Grund besitzt. 


Um Lerneffekten zwischen den Versuchsdurchläufen entgegen zu wirken, wurden mehre- 


re Maßnahmen getroffen. So wurde nach dem ersten Versuchsdurchgang eine weitere Fahrt 
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(a) Variante LKW (b) Variante Baustelle (c) Variante PKW 


Abbildung 5.19: Variationen des Übernahmeszenarios 


eingefügt, die nicht ausgewertet wurde, sondern nur zur Schaffung von Unvorhersehbarkeit 
diente. In dieser zusätzlichen Zwischenfahrt gibt es keinen zweiten Abschnitt der Lange 10 km 
für eine freiwillige Übernahme des Fahrzeugs und auch der Abschnitt mit der Übernahmeauf- 
forderung wird auf 2,5 km verkürzt. Da in diesem Fall zuvor keine Fahrstreifenwechsel durch- 
geführt werden, befindet sich das stehende Hindernis bei dieser Fahrt auf der rechten Spur 
auf Streckenmeter 2200 dieses Teilstücks. Auf diese Art wird mit der bisherigen Reihenfolge 
der Ereignisse gebrochen und der Fahrer deutlich früher als in der regulären Versuchsfahrt 
zur Übernahme aufgefordert. Auch diese Fahrt endet mit dem Halten auf dem nachfolgenden 
Parkplatz. 


Die zweite Versuchsfahrt wurde ebenfalls modifiziert. Zwar bleiben hier die Streckenabschnit- 
te identisch, jedoch wird der LKW entfernt, der von der Automation nicht überholt werden 
kann, wodurch die entsprechende Situation verschwindet. 


Als zusätzliche Variation wurden die Objekte und Umgebungstexturen zwischen den einzel- 
nen Fahrten verändert. So kann trotz identischer Streckenführung die Illusion eines anderen 
Testszenarios erzeugt werden. Abbildung 5.19 zeigt die Variationen in Hindernis, Blockade der 
rechten Spur und Landschaft zum Zeitpunkt kurz nach der Übernahmeaufforderung. 


Der Versuchsablauf für einen Probanden ergibt sich somit wie folgt: 
1. Information über den Versuch 
2. Eingewöhnungsfahrt 


3. Versuchsfahrt 
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4. Zwischenfahrt 
5. Versuchsfahrt ohne freiwillige Ubernahme 
6. Versuchsfahrt 


Für einen fairen Vergleich der beschriebenen Ubergabekonfigurationen wurde deren Zuord- 
nung zu den Versuchsfahrten zwischen den Probanden variiert. Die Versuchsteilnehmer wur- 
den durch persönlichen Kontakt, Aushange in der Maschinenbaufakultat der Technischen Uni- 
versität München oder digitale Aushänge in sozialen Medien rekrutiert. 72% der Probanden 
erhielten eine Aufwandsentschädigung von 30 € für die Teilnahme, der Rest nahm unentgelt- 


lich am Experiment teil. 


Bewertungskriterien 


Die Bewertung der Übernahmesituation erfolgt in dieser Arbeit rein über objektive Kriterien. 
Dafür werden die von der Simulationssoftware aufgezeichneten Fahrzeugsignale genutzt. Die 
Signale werden hierbei in einem Zeitintervall von 12 s betrachtet, beginnend mit der Ausgabe 
der Übernahmeaufforderung. Innerhalb dieser Zeitspanne wird, ausgehend von der Fahrzeug- 
trajektorie, der Geschwindigkeit und der Beschleunigung des Fahrzeugs zum einen das Risi- 
ko einer Kollision abgeschätzt, zum anderen der fahrdynamische Fahrzeugzustand bewertet. 


Hierfür wurden vier Kenngrößen definiert, die nachfolgend vorgestellt werden. 


Das Kollisionsrisiko wird separat für die Längs- und Querbewegung des Fahrzeugs bewertet. 
Da sich Kraftfahrzeuge üblicherweise primär in Längsrichtung bewegen, wird in diesem Fall 
die aktuelle Geschwindigkeit mitberücksichtigt. Als Maß für das Risiko einer Kollision mit 
dem Pannenfahrzeug wird deshalb zu jedem Zeitpunkt im betrachteten Intervall die Time-to- 
Collision zu diesem Hindernis berechnet. Diese Größe beschreibt die Zeitdauer bis zur Kolli- 
sion zweier Objekte unter der Annahme, dass jeweils die momentane Geschwindigkeit beibe- 
halten wird. Sie ergibt sich aus dem Quotienten des aktuellen Abstands der beiden Objekte und 
deren Relativgeschwindigkeit [Hay72]. Der aktuelle Abstand berechnet sich aus deren aktuel- 
len Positionen xggo bzw. xy auf der Strecke . Da sich das Hindernis im Stillstand befindet, ent- 
spricht die Relativgeschwindigkeit direkt dem Anteil der Geschwindigkeit des Ego-Fahrzeugs 
entlang der Strecke vy. Die Kennzahl K, zur Bewertung des Kollisionsrisikos in Längsrichtung 
beschreibt den kleinsten Wert der Time-to-Collision im Zeitfenster zwischen Übernahmeauf- 
forderung und dem Passieren der Querposition der linken Kante des Hindernisses mit der 


vorderen rechten Ecke des Ego-Fahrzeugs gemäß 


Kr = min (= a ze) , (5.10) 


Ux 


Werte kleiner Null für K, sind gleichbedeutend mit einer Kollision. 
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Wenn das Ego-Fahrzeug auf die linke Spur ausweicht, besteht das Risiko einer Kollision mit 
der Schutzplanke auf der linken und dem Hindernis auf der rechten Seite der Spur. Zur Bewer- 
tung dieses Risikos wird eine zweite Kenngröße verwendet. Da die möglichen Kollisionen in 
diesem Fall quer zur Hauptbewegungsrichtung des Fahrzeugs stattfinden, wird hier der kleins- 
te Abstand zur Schutzplanke ds bzw. zum Hindernis dy als Maß verwendet. Für eine sichere 
Fahrt muss eine Position im Korridor zwischen Fahrbahnbegrenzung und Hindernisfahrzeug 
gefunden werden, welche die gegensätzlichen Ziele eines großen Sicherheitsabstandes zu den 
jeweiligen Objekten ausreichend erfüllt. Zur Bewertung des Kollisionsrisikos in Querrichtung 
wird daher das Minimum der beiden Abstände 


K4 = min(ds, dy) 6.11) 


verwendet. So wird ausgeschlossen, dass ein hoher Wert in einer Richtung auf Kosten eines 
niedrigen Werts in der anderen erzielt wird. Analog zur Kennzahl K, zählen auch hier Werte 


kleiner Null als Kollision. 


Als dritte Kennzahl wird mit Hilfe der Abstände der Platzbedarf auf der linken Spur beschrie- 
ben, d.h. wie viel Raum das Ausweichmanöver auf dieser Spur einnimmt. Die Distanz zwischen 
den Punkten, bei denen das Fahrzeug den geringsten Abstand zur Schutzplanke bzw. zum Hin- 


dernis besitzt, wird über die Kennzahl Ka angegeben zu 
Ky = Amax ~ ds - dy, (5.12) 


wobei Amax den Abstand zwischen Hindernis und Schutzplanke beschreibt. Ein optimales 
Fahrverhalten zeichnet sich durch einen konstanten Abstand zu beiden potenziellen Kolli- 
sionsobjekten aus, wodurch sich ein minimales Ka entsprechend der Fahrzeugbreite ergibt. 
Ein Schlingern zwischen diesen Objekten hingegen erhöht den Wert von K4. 


Als letztes wird die Querbeschleunigung des Fahrzeugs a, zur Bewertung herangezogen. Mit 
Ka = max(|ay]) (5.13) 


wird der betragsmäßige Maximalwert der Querbeschleunigung im betrachteten Zeitraum als 
vierte Kenngröße gewählt. Abbildung 5.20 verdeutlicht die Bewertungskriterien anhand einer 
Skizze. 


Für alle vier Kenngrößen wird jeweils die Hypothese aufgestellt, dass durch die kooperative 
Übergabe (Index k) im Mittel Verbesserungen gegenüber Übergaben mit direkter Abschaltung 
(Index d) erzielt werden. Dabei sind für K, und Kg große und für Kı und Ka kleine Werte 
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Abbildung 5.20: Kriterien zur Bewertung des Ausweichmanövers. In der Phase zwischen Übernahmeaufforderung 
(Position A) und Passieren des Hindernisses mit der Fahrzeugfront (Position B) wird die minimale 
Time-to-Collsion K berechnet. Weiterhin wird aus dem kleinsten Abstand zur Schutzplanke (Po- 
sition C) und dem kleinsten Abstand zum Hindernis (Position D) sowohl die minimale Distanz K4 
zu einem Kollisionsobjekt als auch der benötigte Platz auf der Spur Ka ermittelt. Über die gesamte 
Trajektorie hinweg wird zudem die maximale Querbeschleunigung Ka berechnet. 


für die Mittelwerte u der Kenngröße über alle Probanden aus Sicht der Fahrdynamik bzw. 
Fahrsituation besser. Folglich wird geprüft, ob die Nullhypothesen 


Ho : UK, = HK, k (5.14) 

Ho : UK yd = UK yk (5.15) 

Ho : UKy,d < HKak (5.16) 
und 

Hbo : uK„.d © HKu,k (5.17) 


verworfen werden können. Die Prüfung der Hypothesen erfolgt wie im vorherigen Experiment 


mit Hilfe von einseitigen Zweistichproben-t-Tests für abhängige Stichproben. 


Für eine detailliertere Analyse des kooperativen Übergabekonzepts werden zudem die Verläufe 
des Transitionsparameters sowie des bereitgestellten, unterstützenden Lenkmoments betrach- 
tet. 


5.2.2 Ergebnisse 


Für den Vergleich des kooperativen Übergabekonzepts mit der direkten Übergabe nach dem 


aktuellen Stand der Technik wurden für 37 Personen technisch einwandfreie Datensätze auf- 
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gezeichnet. Von diesen Datensätzen müssen fünf Versuchspersonen von der Analyse ausge- 
schlossen werden, weil sie bereits vor Ausgabe der Übernahmeaufforderung die Fahraufgabe 
übernommen oder sie zu diesem Zeitpunkt entgegen der Versuchsvorgabe nicht an das Fahr- 
zeug abgegeben hatten. Der Datensatz einer weiteren Person wird aufgrund gesundheitlicher 
Beschwerden verworfen. Folglich verbleiben die Fahrten mit und ohne kooperative Übergabe 
von 31 Versuchspersonen (13 weiblich, 18 männlich, Alter 18-62 Jahre, Mittelwert 32,90 Jah- 
re, Standardabweichung 11,93 Jahre) als Datengrundlage für die nachfolgende Analyse. Diese 
erfolgt in drei Teilen. Zuerst werden die beiden Übergabekonzepte anhand der Fahrzeugtra- 
jektorien gegenübergestellt. Dieser qualitativen Beurteilung der Ausweichmanöver folgt im 
zweiten Teil die quantitative Bewertung durch die Berechnung der Kenngrößen und Durch- 
führung der im vorherigen Abschnitt beschriebenen Hypothesentests. Im dritten Teil wird der 
Ablauf des Transitionsprozesses gezeigt und für ausgewählte Versuchspersonen im Detail vor- 
gestellt, wie die kooperative Transitionsphase den Übergabeprozess im Vergleich zur direkten 


Transition beeinflusst. 


Fahrzeugtrajektorien 


Abbildung 5.21 zeigt die Fahrzeugschwerpunkttrajektorien der 31 Versuchspersonen bei sofor- 
tiger vollständiger Übergabe der Fahrzeugführung mit der Übernahmeaufforderung. Es sei dar- 
auf hingewiesen, dass bei der Darstellung der Trajektorien 450 m in Längsrichtung gegenüber 
14 m quer zur Fahrbahn gezeigt werden. Durch die ungleiche Skalierung der Achsen ergibt sich 
eine Verzerrung, welche besonders an der Darstellung des Hindernisfahrzeugs im Vergleich 
zur verhältnisgetreuen Darstellung aus Abbildung 5.20 deutlich wird. Die Trajektorien zeigen 
eine große Streuung hinsichtlich des Starts des Ausweichmanövers, des Stabilisierungspro- 
zesses auf der linken Spur und der Spurauswahl nach Passieren des Hindernisses. Außerdem 
hervorzuheben sind die Kollisionen mit der Schutzplanke, welche sich unter Berücksichtigung 
der Fahrzeuggeometrie für zwei der Probanden ergäben. Dabei ist zu beachten, dass die Fahrsi- 
mulationssoftware keine Kollisionsabfrage zwischen dem Ego-Fahrzeug und anderen Objek- 
ten durchführt. Das Auftreten einer Kollision wirkt sich somit weder auf das Fahrverhalten 
aus, noch wird dem Fahrer die Kollision auf eine andere Art angezeigt, d.h. die Fahrer müssen 


die Kollision nicht zwingend bemerkt haben. 


Die Trajektorien der Fahrzeugschwerpunkte für den Fall, dass die Versuchspersonen während 
des Übernahmeprozesses durch eine kooperative Transition unterstützt werden, zeigt Abbil- 
dung 5.22. Da wie zuvor keine Vorgabe für die Spurwahl nach dem Ausweichvorgang gemacht 
wurde, ergibt sich hier am Ende des betrachteten Zeitraums ebenfalls eine große Varianz zwi- 
schen den Probanden. Auch die individuellen Startpunkte des Ausweichmanövers werden bei- 
behalten. Jedoch weisen die Trajektorien auf der linken Spur im Gegensatz zu den Trajektorien 


im unassistierten Fall eine erkennbare Bündelung auf. Außerdem käme es unter Verwendung 
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des Konzepts der kooperativen Transition zu keiner Kollision, auch wenn ein Proband einen 


Kontakt mit der Schutzplanke nur knapp vermeiden konnte. 


Querposition in m 
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Abbildung 5.21: Fahrzeugschwerpunkttrajektorien aller Probanden fiir die Versuchsdurchgange mit der direkten 
Ubergabe 
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Abbildung 5.22: Fahrzeugschwerpunkttrajektorien aller Probanden für die Versuchsdurchgänge mit der kooperati- 
ven Übergabe 


Kenngrößen und statistischer Vergleich 


Der quantitative Vergleich zwischen den beiden Transitionskonzepten erfolgt anhand der vor- 
definierten Kenngrößen. In den nachfolgenden Absätzen werden die wichtigsten statistischen 
Werte für beide Konzepte zusammengefasst. Für detaillierte Werte für jeden einzelnen Pro- 


banden sei auf die Tabellen A.4 und A.5 im Anhang A.2 verwiesen. 


Die Versuchsdurchgänge mit direkter Abschaltung der Querführungsregelung ergeben eine 
mittlere minimale Time-to-Collision K, von 1,783 s bei einer Standardabweichung von 0,798 s. 
Bei vier Versuchspersonen liegt der Wert unter 1s, einer der Probanden ist sogar nur 0,161s 
von einer Kollision mit dem Hindernisfahrzeug entfernt. Bei Anwendung einer kooperati- 
ven Transitionsphase liegt hingegen die mittlere Zeitlücke bei 2,167 s (Standardabweichung 
0,675 s) und nur in einem Testdurchlauf unterschreitet ein Proband mit einem K; von 0,891 s 


den Wert von 1 s. Der t-Test zur Überprüfung, ob die Erhöhung des Mittelwertes um knapp 0,4 s 
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Abbildung 5.23: Statistischer Vergleich der mini- Abbildung 5.24: Statistischer Vergleich des mini- 


malen Zeitlücke zur Kollision K; malen lateralen Abstands zu ande- 
zwischen direkter und kooperati- ren Objekten Ky zwischen direkter 
ver Transition und kooperativer Transition 


durch Einführung der kooperativen Transition statistisch signifikant ist, ergibt einen p-Wert 
von 0,0128, wodurch die Signifikanz der Erhöhung bestätigt werden kann. Der statistische 
Vergleich ist in Abbildung 5.23 veranschaulicht. 


Auch für den kleinsten lateralen Abstand Kg ergeben sich deutliche Unterschiede, wie Ab- 
bildung 5.24 zeigt. So ist der Mittelwert bei Nutzung des sofortigen Übergabekonzepts mit 
1,191 m über 30 cm geringer als der Wert von 1,539 m bei der graduellen Übergabe (Standard- 
abweichungen 0,555 m bzw. 0,327 m). Die Anwendung des t-Tests ergibt einen p-Wert von 
0,0015, wodurch die Verbesserung als statistisch sehr signifikant bezeichnet werden kann. 
Wie bereits an den Fahrzeugtrajektorien bemerkt, ergäben sich für die direkte Übergabe bei 
zwei Versuchspersonen Kollisionen. Die zugehörigen Kg-Werte von -0,002 m und -0,006 m zei- 
gen, dass die Überschneidung mit der Schutzplanke nur wenige Millimeter beträgt, wobei auf 
Grund der nicht vorhandenen Rückmeldung über die Kollision in der Simulation keine Aus- 
sagen über potenzielle Folgereaktionen getroffen werden können. Die ermittelten Abstände 
zur Schutzplanke zeigen zudem, dass zwei weitere Probanden die 0,5 m von der Schutzplan- 
ke entfernte Fahrbahnbegrenzungslinie überschritten haben, wobei dies in einem Fall bei der 
direkten Transition (Kg = 0,323 m) und für den anderen Fall bei der kooperativen Transition 
(K4 = 0,133 m) geschieht. Auf der rechten Seite überschreiten vier Probanden die rechte Spur- 
begrenzung im Bereich des stehenden Hindernisses. Hierbei unterschreiten drei Versuchsper- 
sonen die 1m vom Hindernis entfernte Spurmarkierung bei ihrer Fahrt ohne haptische Unter- 
stützung während der Übergabe und eine Person tut dies bei beiden Methoden. Der Minimal- 
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Abbildung 5.25: Statistischer Vergleich des Platz- Abbildung 5.26: Statistischer Vergleich der ma- 


bedarfs auf der Ausweichspur Ka ximalen Querbeschleunigung Ka 
zwischen direkter und kooperati- zwischen direkter und kooperati- 
ver Transition ver Transition 


wert des lateralen Abstands zum Hindernis über alle Teilnehmer beträgt nur 0,058 m für die 
direkte und 0,177 m für die kooperative Transition. 


Aus den kleinsten Abständen zu den potenziellen Kollisionsobjekten rechts und links wirde 
auch der in Querrichtung benötigte Platz Kı auf der linken Spur berechnet (siehe Abbildung 
5.25). Für die direkte Transitionsmethode ergibt sich ein mittlerer Wert für Kı von 2,323 m bei 
einer Standardabweichung von 0,795 m. Über die Fahrzeugbreite hinaus benötigen die Proban- 
den bei der direkten Übergabe demnach im Mittel zusätzlich 0,658 m. Die beiden Versuchsper- 
sonen, die auch mit der Schutzplanke kollidieren, benötigen für ihr Ausweichmanöver mit 
4,446 m und 4,798 m den meisten Raum, da sie trotzdem auf Höhe des Hindernisses eng an 
diesem vorbeifahren. Mit der kooperativen Transition beträgt Ka im Mittel 1,957 m (Standard- 
abweichung 0,618 m) und nur der Proband, der sowohl den kleinsten Abstand zur Schutzplanke 
als auch zum Hindernisfahrzeug generiert hat, überschreitet mit einem Wert von 5,211 m die 
Spurbreite von 4m. Der höhere Platzbedarf bei direktem Abschalten der Automation gegen- 
über der graduellen Methode ist statistisch signifikant (p = 0,0195). 


Das letzte Bewertungskriterium ist die betragsmäßig maximale Querbeschleunigung Ka wäh- 
rend des Übergabeprozesses. Ohne Unterstützung liegen die Werte im Mittel bei 3,718 m/s? mit 
einer vergleichsweise hohen Standardabweichung von 2,015 m/s?. Zwei Probanden erreichen 
mit Werten von 8,833 m/s? und 8,939 m/s? sogar kritische Werte in der Nähe der Kraftschluss- 
grenze und nur 19 der 31 Probanden bleiben unterhalb des Wertes von 4 m/s?, welcher wäh- 
rend einer regulären Fahrt in der Regel nicht überschritten wird [WHLS15, S.24]. Werden die 
Probanden hingegen im Verlauf der Übergabe haptisch unterstützt, liegt der Mittelwert über 
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alle Probanden 0,727 m/s? niedriger bei 2,991 m/s?. Auch die Streuung nimmt etwas ab und 
die Standardabweichung beträgt 1,572 m/s”. Zudem liegt der maximal erreichte Wert nur bei 
8,079 m/s? und nur sechs statt zwölf Probanden überschreiten den als Komfortgrenze betrach- 
teten Wert von 4m/s?. Der t-Test liefert einen p-Wert von 0,0630. Damit ist die Verbesserung 
in Form einer Reduktion von Kg durch die kooperative Transition statistisch nicht signifikant. 
Die grafische Darstellung des statistischen Vergleichs ist in Abbildung 5.26 gegeben. Eine ab- 
schließende Übersicht über alle statistischen Vergleiche zeigt Tabelle 5.3. 


Tabelle 5.3: Übersicht der Ergebnisse des statistischen Vergleichs von direkter und kooperativer Transition 


Nullhypothese Hp p-Wert Signifikanzniveau 


HK,,d Z HK, k 0,0128 signifikant 
HUK4,d = UK yk 0,0015 sehr signifikant 
HKa,d © HKyk 0,0195 signifikant 
HKa,d © HKa k 0,0630 nicht signifikant 


Ablauf des Transitionsprozesses 


Um zu erkennen, wie die Kenngrößen durch die kooperative Transition verbessert werden, 
wird zunächst der Verlauf des Transitionsparameters «œ betrachtet. Abbildung 5.27 zeigt die 
zeitliche Veränderung der Transitionsparameter aller Versuchspersonen von Beginn der Tran- 
sitionsphase durch die Detektion der Hände am Lenkrad bis zum Ende der Transitionsphase. 
Dort erreicht der Parameter den Wert Null und das System stellt keine Unterstützung mehr 
bereit. Es ist eine hohe Varianz zwischen den Probanden zu erkennen. Die Zeitdauer, bis die 
Hände sicher am Lenkrad erkannt werden, beträgt zwischen 1,017 s und 4,900 s (Mittelwert 
3,283 s, Standardabweichung 1,125 s) und die Transitionsphase endet im Mittel 4,139 s später. 
Wie in Abschnitt 5.2.1 beschrieben, sollte æ für die Dauer eines Prädiktionshorizonts, also in 
diesem Fall 1,5 s, den Wert 1 aufweisen und dann über 2,5 s linear auf 0 abfallen, wodurch sich 
eine Gesamtdauer der Transitionsphase von 4s ergäbe. Die leichte Verzögerung ist der imper- 
fekten Synchronisation zwischen Regler und Fahrsimulator geschuldet’, bei der einzelne Da- 
ten nicht rechtzeitig übertragen und somit die vorherigen Werte weiter verwendet werden. Die 
lässt sich in Abbildung 5.27 an den kleinen Stufen im linearen Abschnitt des Transitionsver- 
laufs erkennen. Da dies bei allen Probanden nahezu identisch auftritt (Standardabweichung der 


Transitionsdauer 0,029 s), wird der Effekt für die Auswertung nicht weiter berücksichtigt. 


Die große Varianz in der Lage des Startzeitpunkts der Transitionsphase erschwert einen di- 
rekten Vergleich aller Probanden, da sich mit der Zeit und darüber hinaus mit den individu- 
ellen Bremseingriffen der Versuchsteilnehmer auch die Verkehrssituation ändert und somit 


zu einem Zeitpunkt nicht für alle übereinstimmt. Daher erfolgt ein Vergleich exemplarisch 


7 Die Hardware des Fahrsimulators ist kein Echtzeitsystem. 
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Abbildung 5.27: Verlauf des Transitionsparameters fiir alle Probanden bei der kooperativen Transition 


fiir Personen, bei denen die Transitionsphase nahezu im identischen Streckenabschnitt liegt. 
Dafiir werden die Probanden mit den Nummern 20, 1 und 31 nacheinander betrachtet. Die 
Trajektorien dieser Beispielpersonen sind jeweils mit und ohne Unterstützung während der 
Transitionsphase in den ersten drei Teilabbildungen von Abbildung 5.28 dargestellt. Der Ver- 
lauf des assistierenden Moments der Automation wahrend der Transitionsphase findet sich fiir 
alle drei Probanden gemeinsam in der vierten Teilabbildung. Die Hande der drei Probanden 
werden nach 2,883 s, 2,917 s bzw. 2,900 s am Lenkrad erkannt. Durch leichte Unterschiede in 
der Bremsreaktion wird die Transitionsphase dann 94,4 m, 95,6 m bzw. 94,6 m nach der Überga- 
beaufforderung initiiert und endet weitere 128,8 m, 126,6 m bzw. 127,0 m danach. Damit liegt 
das Ende für alle drei Probanden über 20m hinter dem Hindernis. Aufgrund des geringen 
Abstands zur Referenz und des reduzierten Transitionsparameters ist das Automationsmo- 
ment jedoch schon deutlich früher sehr gering und bereits 15 m vor dem Hindernis kleiner als 
0,1 Nm. Obwohl die Transitionsphase für die Probanden zeitlich und räumlich nahezu iden- 


tisch ist, unterscheidet sich deren Fahrverhalten deutlich. 


Betrachtet man die Spurwechseltrajektorie bei Anwendung des kooperativen Transitionskon- 
zepts für Versuchsperson 20, so zeigt sich, dass sie sich zunächst deutlich links der Referenztra- 
jektorie bewegt, dieser aber in der zweiten Hälfte der Übergabe gut folgt. Dies äußert sich auch 
im Verlauf des unterstützenden Moments. Zu Beginn des Spurwechsels lenkt die Automation 
mit bis zu 1,6 Nm gegen das vom Fahrer initiierte Ausweichmanöver. Sobald der Fahrer jedoch 
der Referenz folgt und das Fahrzeug konstant in der Mitte der linken Spur hält, wird das Mo- 
ment heruntergefahren und dieser nicht weiter beeinflusst. Auch bei der direkten Transition 
führt der Versuchsteilnehmer einen Spurwechsel durch, der nahe an dem Referenzverlauf liegt. 
Dies gelingt ihm jedoch nur durch eine deutliche Abbremsung des Fahrzeugs auf 82 km/h, was 
in der Grafik nur indirekt an der im Bewertungszeitraum von 12 s ca. 50 m geringeren zurück- 


gelegten Strecke zu sehen ist. Bei insgesamt 19 der 31 Versuchspersonen wirkt das Moment 
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Abbildung 5.28: Übergabesituationen von ausgewählten Probanden für die direkte (rot) und die kooperative (grün) 
Transition. Die schwarze gestrichelte Linie beschreibt die Referenztrajektorie. Die vertikalen Linien 
geben jeweils Start und Ende der Transitionsphase an. 
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der Automation der Spurwechselrichtung entgegen und die Ausweichreaktion der Probanden 


wird dadurch abgemildert. 


So auch im zweiten Beispiel (Versuchsperson 1), bei dem der Wert des entgegengesetzten Lenk- 
moments jedoch etwas geringer ausfällt und knapp unter 1N m bleibt. Dafür erfährt dieser 
Proband ein Lenkmoment auf Höhe des Hindernisses, welches ihn von diesem weg und zur 
Mitte der linken Spur führen soll. So wird auch die Gegenbewegung gedämpft. Im Kontrast 
zum ersten Beispiel gelingt es diesem Fahrer schlechter, das Spurwechselmanöver ohne ko- 
operierende Automation durchzuführen. Die ungedämpften Reaktionen erfordern wiederum 
stärkere Ausgleichsreaktionen, wodurch eine Schwingung in der Querposition entsteht. Somit 
wird mehr Platz auf der Zielspur benötigt und der Abstand zu potenziellen Kollisionsobjekten 


verringert sich. 


Die dritte Versuchsperson mit der Nummer 31 steht beispielhaft für einen von 12 Probanden, 
bei denen das Spurwechselmanöver durch die Automation verstärkt wird. Der Fahrer erhält 
während des gesamten Manövers ein zusätzliches Lenkmoment nach links, um die Spurwech- 
selreaktion so zu fördern. Mit diesem Moment gelingt es dem Fahrer, der Referenz quasi ideal 
zu folgen. Ist diese Unterstützung nicht vorhanden, wie beim direkten Transitionskonzept, 
verlässt die Person die Mittelspur erst viel knapper vor dem Hindernis. Die darauf folgen- 
de starke Ausweichreaktion wird zudem erst deutlich links der Mitte der linken Spur wieder 


abgefangen. 


5.2.3 Interpretation und Zusammenfassung 


Zusammenfassend weisen die Ergebnisse eine klare Verbesserung der Sicherheit durch Ein- 
führung einer Phase der kooperativen Transition, im Vergleich zu einer direkten Übergabe der 
Fahrzeugkontrolle unmittelbar nach der Übernahmeaufforderung, auf. Alle vier Kenngrößen 
zeigen eine erhöhte Sicherheit, d.h. größere Abstände und Zeitlücken zu anderen Objekten 
sowie stabileres Fahrverhalten durch kleinere Querbeschleunigungen und weniger Querbe- 
wegung auf der linken Spur, wenn die Übergaben mit dem kooperativen Transitionskonzept 
erfolgen. Die Erhöhung der Time-to-Collision und die Verringerung des Platzbedarfs auf der 
Zielspur sind statistisch signifikant, die Steigerung des lateralen Abstands zum Hindernisfahr- 
zeug bzw. zur Schutzplanke sehr signifikant. Bei der maximalen Querbeschleunigung liegt der 
p-Wert mit 0,0630 geringfügig über dem Signifikanzniveau von 5 % und daher kein signifi- 
kanter Unterschied vor. Es ist hierbei jedoch zu beachten, dass das Experiment mit einem 
statischen Fahrsimulator durchgeführt wurde. Die Beschleunigungen beeinflussen zwar die 
Simulation, können aber von den Versuchsteilnehmern nicht vestibulär wahrgenommen wer- 
den. Wie in [CWV*'11] gezeigt, können Fahrer aus diesem Grund in realen Fahrsituationen ein 
verändertes Fahrverhalten aufweisen und beispielsweise Manöver weniger dynamisch durch- 


führen. 
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Aufschluss über die Ursache für die Verbesserung durch die kooperative Transition gibt die 
Betrachtung des unterstützenden Moments. Bei einem Großteil der Probanden wird deren 
Ausweichreaktion durch ein Lenkmoment nach rechts abgemildert. Die Trajektorien der Ver- 
suchsdurchgänge mit der direkten Übergabe der Fahrzeugkontrolle zeigen die große Gefahr 
einer Überreaktion, wenn die Probanden das Manöver selbstständig, d.h. ohne dieses Gegen- 
moment, durchführen. Für die restlichen Versuchsteilnehmer regt die Automation die Fahrer 
zum Spurwechsel nach links an. Ohne haptische Unterstützung fahren diese lange auf das 
Hindernis zu, wodurch sich die Kritikalität der Fahrsituation verschärft. Mit der kooperativen 
Transitionsphase werden sie jedoch bereits früh durch die Automation zu einer Lenkbewe- 
gung animiert. Auf diese Art wird die Dynamik des Spurwechsels, analog zum Gegenlenken, 
ebenfalls vermindert, da die Probanden andernfalls erst kurz vor dem Hindernis ein aggressi- 
ves Spurwechselmanöver durchführen. Der von der Automation initiierte frühere Spurwechsel 
trägt so zur höheren Time-to-Collision für diesen Teil der Probanden bei. Unabhängig davon, 
ob die Versuchspersonen in ihrer Reaktion gebremst oder zu einer Handlung motiviert wer- 
den, führt die kooperative Transition zu einer gemäßigteren Einfahrt in die Nebenspur und 
damit zu einer besseren Kontrollierbarkeit. Die geringere Querbewegung im Korridor zwi- 
schen Schutzplanke und Hindernisfahrzeug belegt diese erhöhte Fahrstabilität. Im Gegensatz 
dazu erfordert das schnelle Anlenken des Spurwechsels auch eine starke Gegenreaktion, um 
eine Kollision mit der Schutzplanke zu vermeiden. Dies hat wiederum eine Lenkreaktion nach 
links zur Folge, um das Fahrzeug vor dem Hindernis abzufangen und der Prozess beginnt von 
vorne. Diese Schwingungen sind deutlich in den Trajektorien bei Verwendung der direkten 
Transitionsmethode zu erkennen. Dass nicht alle Teilnehmer in der Lage sind, diese Dyna- 
mik zu kontrollieren, zeigen die Kollisionen mit der Schutzplanke bei zwei Versuchspersonen. 
Eine weitere Person entgeht einer Kollision mit dem Hindernis bei der Gegenbewegung nur 
knapp mit einem Abstand von 6 cm. Insgesamt zeigt der Vergleich der Übergaben mit und ohne 
Einführung einer haptischen Transitionsphase, dass die neue Funktion den Versuchspersonen 
unabhängig von deren Verhaltensweise dabei helfen kann, die Übernahmesituation besser zu 
meistern. Die späten und/oder heftigen Reaktionen der Probanden sind Indikatoren für eine 
Fehleinschätzung der Lage aufgrund mangelhaften Situationsbewusstseins. Die auf dieser Ba- 
sis getroffenen suboptimalen Entscheidungen der Probanden lassen sich im Experiment durch 
den Einsatz einer kooperativen Transitionsphase korrigieren und so die Fahrsicherheit ver- 


bessern. 


Aus Anwendungssicht noch nicht optimal ist die im Versuch vordefinierte Zeitspanne für die 
Transitionsphase von 4s. Die hohe Varianz in der Dauer der Präparationsphase, welche mit 
dem Erkennen der Hände am Lenkrad endet, überträgt sich so auch auf die Gesamtzeit des 
Übergabeprozesses. Zudem wird die Zeitdauer durch die Verzögerungen in der Kommunika- 
tion zwischen dem Rechner, auf dem die Reglung abläuft, und dem Fahrsimulator um weitere 
0,139s im Mittel verzögert. Zwar erlaubt die Festlegung einer konstanten Transitionsdauer 


einen fairen Vergleich zwischen den Probanden, da der Transitionsparameter für alle Teilneh- 
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mer identisch verlauft, die Transitionsphase tiberschreitet so jedoch bei den meisten Proban- 
den das geplante späteste Abschalten der Assistenzfunktion auf Höhe des Hindernisses. Auch 
wenn die Unterstützung auf der linken Spur in der Regel durch die Nähe zur Referenztrajekto- 
rie und die fortgeschrittene Reduktion des Transitionsparameters gering ist, wird der Verlauf 
des Transitionsparameters im nachfolgenden Experiment so modifiziert, dass die Transitions- 


phase garantiert vor Erreichen des Hindernisses abgeschlossen ist. 


5.3 Vergleich von kooperativen Übergaben der 
Fahrzeugquerführung mit zeitbasiertem und 


adaptivem Transitionsverlauf 


Das vorherige Experiment hat gezeigt, dass die Einführung einer kooperativen Transitions- 
phase zu Verbesserungen hinsichtlich der sicherheitsrelevanten Kenngrößen führt. Der Über- 
gabevorgang, repräsentiert durch den Transitionsparameter «, verlief dabei für alle Probanden 
identisch und wurde nicht durch die individuelle Reaktion der Versuchspersonen beeinflusst. 
In Kapitel 4 wurde ein Verfahren vorgestellt, welches erlaubt, den Transitionsparameter des 
Menschen aus seiner Lenkaktion zu schätzen, das Modell des Menschen entsprechend anzu- 
passen und ihn darauf basierend angemessen zu unterstützen. Deshalb wurde ein weiteres 
Experiment durchgeführt, um zu prüfen, inwiefern eine solche individuelle Modelladaption 
Vorteile gegenüber einer zeitbasiert vorgegebenen Transitionsphase besitzt. Die Beschreibung 
des Versuchs, die Vorstellung der Ergebnisse und deren Diskussion sind Gegenstand der nach- 
folgenden Abschnitte. 


5.3.1 Versuchsbeschreibung 


Der Versuch wurde am selben Simulator und in einem ähnlichen Szenario wie das vorhe- 
rige Experiment durchgeführt. Aus diesem Grund liegt der Fokus in der nachfolgenden Be- 
schreibung von Versuchsaufbau, Testszenario, Transitionsvarianten, Versuchsdurchführung 
und Bewertungskriterien auf den Unterschieden zu diesem Experiment. Details zu den ande- 
ren, unveränderten Aspekten sind den entsprechenden Abschnitten in der Beschreibung des 


vorangegangenen Experiments zu entnehmen (Abschnitt 5.2.1). 


Anpassungen von Versuchsaufbau und Szenario 


Der Versuchsaufbau ist in diesem Experiment nahezu identisch zum vorherigen. Am Projek- 


tionssystem und dem Simulationsrechner-Netzwerk wurden ebenso wie an der Simulations- 
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(c) Aktiv (d) Ubernahmeaufforderung 


Abbildung 5.29: Uberarbeitetes Konzept zur Anzeige des Zustands der Automation 


software und der Nebenaufgabe keine Anderungen vorgenommen. Auch die Komponenten 
Langsregelung, Referenztrajektoriengenerierung und Systemmodell bleiben im Vergleich zum 


vorherigen Experiment unverandert. 


Änderungen wurden jedoch an der Mensch-Maschine-Schnittstelle durchgeführt. So wurde 
zum einen die Darstellung der Anzeigen des Systemzustands und der Ubernahmeaufforderung 
ansprechender gestaltet. Das neue Design für die Zustände Inaktiv-nicht Verfügbar, Inaktiv- 
Verfügbar und Aktiv sowie die Aufforderung zur Übernahme zeigt Abbildung 5.29. Zum an- 
deren wurde dem Lenkrad ein weiteres Bedienelement hinzugefügt. Hier wurden rechts und 
links jeweils ein Paddle angebracht, welche eine stufenlose Einstellung eines Parameters er- 


möglicht. 


Da der Fokus in diesem Experiment ausschließlich auf der Übernahmesituation liegt, wur- 
de weiterhin das Szenario aus dem vorherigen Experiment leicht modifiziert und der LKW 
entfernt, der die freiwillige Übernahme induzieren soll. Der entsprechende Streckenabschnitt 
bleibt jedoch erhalten, sodass die Probanden nun bis zu 15,25 km hochautomatisierte Fahrt bis 
zur Übernahmeaufforderung zurücklegen. Ohne die Verzögerung durch den langsam fahren- 


den LKW werden 10 -13 min benötigt, um das gesamte Szenario zu absolvieren. 
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Konzepte zur Gestaltung des Transitionsparameterverlaufs 


Im Experiment soll der Einfluss verschiedener Konzepte zur Ermittlung des Transitionspara- 
meterverlaufs auf die Ubergabesituation untersucht werden. Es werden folgende drei Auspra- 
gungen betrachtet: 


e Kooperative Übergabe mit zeitbasierter Vorgabe des Transitionsparameters 
e Kooperative Übergabe mit manueller Vorgabe des Transitionsparameters 
e Kooperative Übergabe mit automatisierter Adaption des Transitionsparameters 


Bei allen Konzepten beginnt die Transition, sobald die Hände des Probanden am Lenkrad er- 
kannt werden (tHo). Das erste Konzept basiert auf der kooperativen Übergabe aus dem zweiten 
Experiment aus Abschnitt 5.2.1. So folgt der Transitionsparameter wie zuvor einem fest vorge- 
gebenen Verlauf. Jedoch wird jetzt nicht die Dauer der Transitionsphase vorgegeben, sondern 
der gesamte Ubergabeprozess auf tg = 6s beschränkt. Da die anderen Konzepte zu jedem 
Zeitpunkt nur einen einzigen Wert und keine Trajektorie für «Ąą vorgeben, wird der Transi- 
tionsparameter hier ebenfalls über den Prädiktionshorizont konstant angenommen und nur 
zwischen zwei Optimierungsschritten verändert, um die Vergleichbarkeit zu gewährleisten. 
Der aktuelle Wert von æa während des Übergabeprozesses ergibt sich in Abhängigkeit von 


der vergangenen Zeit t seit der Aufforderung zu 


1 t< tHo 
aalt) =} tHostst, (5.18) 
0 t > tg 


wodurch eine lineare Abnahme von a, während der Transitionsphase generiert wird. Für den 
Transitionsparameter im Modell des menschlichen Gütemaßes ay wird angenommen, dass er 


im Sinne der idealen Transition entsprechend der Beziehung ay = 1 - a, ansteigt. 


Der Verlauf der Transitionsparameter des zweiten Konzepts ist identisch zum ersten, es sei 
denn, die Versuchsperson möchte die Übergabe beschleunigen. Dazu kann der Proband die 
Paddels am Lenkrad anziehen und so direkt seinen Wert von æa zwischen 0 und 1 einstellen, 
wobei sich der Wert anschließend nicht mehr anheben lässt. Liegt der Wert unter dem linea- 
ren Verlauf, passt die Automation den Transitionsparameter aq (und komplementär dazu ay) 
entsprechend an. Im Laufe des Experiments hat sich gezeigt, dass nur ein Versuchsteilnehmer 
von dieser Funktion in der Art Gebrauch gemacht hat, dass es sich auf den Verlauf von aa 
bzw. ayy ausgewirkt hat. Daher wird diese Variante im Weiteren nicht mehr berücksichtigt, da 


sie ansonsten identisch zum ersten Konzept ist. 
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Das dritte und letzte Konzept beinhaltet das neu entwickelte und in Kapitel 4 vorgestellte 
Modelladaptionsverfahren, mit dem ap aus einer Messung des Lenkmoments des Menschen 
geschätzt und aq entsprechend angepasst wird. Für die Anwendung mit realen Messdaten 
werden dabei zwei Modifikationen durchgeführt, um das Verfahren robuster zu gestalten. Ana- 
log zur Simulation in Abschnitt 4.3 wird die Schätzung von ay auf Werte zwischen 0 und 1 
begrenzt, um mit der Modellierung kompatible Werte zu garantieren (vgl. Definition 3.6). Wei- 
terhin erfolgt eine Limitierung der Schrittweite der Adaption p auf Werte zwischen 0 und a: 
Hierdurch wird einerseits sichergestellt, dass eine einmal angenommene Beteiligung an der 
Fahraufgabe nicht wieder an die Automation zurückgegeben werden kann, andererseits ver- 
hindert die Begrenzung der Adaptionsschrittweite nach oben eine sprunghafte Änderung des 
Transitionsparameters und damit auch des unterstützenden Moments. Bei der Simulatortak- 
trate von 60 Hz erzeugt die gewählte maximale Schrittweite eine minimale Transitionsphase 


von 0,5 s. 


Um in alle Fallen eine vollständige Übergabe innerhalb der vorgegebenen Zeit zu garantieren, 
d.h. æa (tg) = 0, und zeitgleich jedoch kein sprunghaftes Abschalten am Ende zu erzeugen, wird 
unabhängig vom Transitionskonzept eine obere Schranke für aq analog zu Gleichung (5.18) 
eingeführt. Liegt der Transitionsparameter der Automation in der letzten Sekunde vor Ende 
der Übergabe oberhalb eines linearen Verlaufs von 1 auf 0 in diesem Zeitraum, so wird der 
Transitionsparameter auf diesen Wert begrenzt und so die Transition innerhalb der vordefi- 
nierten Dauer erzwungen. Die Parameter der Querregelung sind im Vergleich zum Vorgänger- 
experiment unverändert und können dem entsprechenden Abschnitt unter 5.2.1 entnommen 
werden. Ebenfalls wie zuvor schaltet die Längsregelung bei allen Konzepten zum Zeitpunkt 


der Übernahmeaufforderung ab. 


Versuchsdurchführung 


Wie in den anderen Experimenten führt jede Versuchsperson mehrere Versuchsdurchgänge 
durch, in denen sie das Szenario absolviert und jeweils eine andere Methode zur Bestimmung 
des Transitionsparameterverlaufs angewendet wird. Die Reihenfolge der Konzepte wurde auch 
in diesem Experiment randomisiert, um den Einfluss von Lernerfahrungen auf das Ergebnis 
zu reduzieren. Zudem haben sich die Teilnehmer mit dem Simulator und der Bedienung des 
Fahrzeugs zu Beginn des Experiments vertraut machen können. Weiterhin wurde wie zuvor 
die Darstellung der Umgebung und der Verkehrsobjekte variiert und eine Zwischenfahrt ein- 
gefügt, die nicht in die Bewertung einfließt, sondern nur dazu dient, den gewohnten Ablauf 
zu unterbrechen. Die Zwischenfahrt ist bis zum Abschnitt mit der Übernahmeaufforderung 
unverändert. In diesem Experiment folgt dann jedoch nach einer 1700 m langen Geraden eine 
600 m lange Rechtskurve mit einem Kurvenradius von 900 m. In der Mitte dieser Kurve er- 
folgt die Aufforderung zur Übergabe auf der rechten Spur, sodass der Fahrer ein Moment nach 


rechts aufbringen muss, um die Spur nicht nach links zu verlassen. Die Zwischenfahrt erfolgt 
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auch unter Verwendung der automatisierten Adaption. Somit ergibt sich der Versuchsablauf 


analog zum Experiment zum Vergleich von direkter und kooperativer Transition zu: 
1. Information über den Versuch 
2. Eingewöhnungsfahrt 
3. Versuchsfahrt 
4. Zwischenfahrt 
5. Versuchsfahrt 
6. Versuchsfahrt 


Die Teilnehmer wurden erneut über Aushänge an der Universität, Ankündigungen in den so- 
zialen Medien und persönlichen Kontakt angeworben und erhielten jeweils eine Entschädi- 


gung von 30 € für den ihnen entstandenen Aufwand. 


Bewertungskriterien 


Auch die Bewertungskriterien sind weitgehend identisch zu denen des zweiten Experiments 
(vgl. Abschnitt 5.2.1). So wird das Kollisionsrisiko und der fahrdynamische Zustand während 
des Manövers ebenfalls anhand der minimalen Time-to-Collision K+, des minimalen Abstands 
zu anderen Objekten Kg, der Breite des benötigten Korridors auf der Zielspur Ka sowie der 
betragsmäßig maximalen Querbeschleunigung Ka beurteilt. Da in diesem Experiment sowohl 
die zeitbasierte als auch die adaptive kooperative Transition dem Fahrer helfen sollen, einer 
vordefinierten Referenztrajektorie zu folgen, wird der laterale Abstand zu dieser Trajektorie 
ebenfalls als Vergleichskriterium verwendet. Als Kennzahl wird hierfür der mittlere absolute 
Fehler Ky gemäß 


I 3 
Ky=— Sly-yl (5.19) 
n k1 


berechnet. Der betrachtete Zeitraum zur Berechnung dieses Fehlers endet, sobald das Ego- 
Fahrzeug die Streckenposition des Hindernisfahrzeugs erreicht hat. Eine Betrachtung über 
diesen Zeitpunkt hinaus ist nicht sinnvoll, da die Automation im Anschluss das Folgen der Re- 
ferenz nicht mehr durch Stelleingriffe unterstützt und die Probanden ihre Zielvorgabe beliebig 
wählen können. Der Wert der Kennzahl sollte möglichst gering sein, da dann das Fahrzeug die 


Zielvorgabe einhält. 
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Für alle Kenngrößen wird jeweils die Hypothese aufgestellt, dass die automatisierte Adaption 
des Transitionsparameters (Index a) zu besseren Werten führt als die zeitbasierte Vorgabe (In- 
dex z). Daraus ergeben sich analog zum vorherigen Experiment die Nullhypothesen der ersten 


vier Kenngrößen zu 


Ho : uK,,z > HK.,a (5.20) 

Ho *HKy,z = HKy,a (5.21) 

Ho *HKy,z = Kya (5.22) 

Ho: Kaz < HKaa- (5.23) 
Diese werden durch die Nullhypothese für die Kennzahl Ky gemäß 

Ho: HKy,z. = HKy,a (5.24) 


ergänzt. Somit entsteht ein Satz von fünf Nullhypothesen, für die jeweils separat geprüft wird, 
ob sie abgelehnt werden können. Der Test erfolgt erneut mit Hilfe des einseitigen Zweistich- 


proben-t-Tests für abhängige Stichproben. 


Da die Adaption eine Messung des Lenkmoments des Fahrers benötigt, wird dieses neben 
dem Transitionsparameterverlauf und dem Lenkmoment der Automation ebenfalls zur Ana- 


lyse und Bewertung der Übergabekonzepte herangezogen. 


5.3.2 Ergebnisse 


Insgesamt wurden im Rahmen dieses Experiments Datensätze von 35 neuen Versuchsteilneh- 
mern aufgezeichnet. Bei vier dieser Probanden trat in mindestens einem Versuchsdurchgang 
ein technischer Fehler mit dem Simulatorsystem auf, sodass dies Datensätze dieser Personen 
komplett von der Bewertung ausgeschlossen werden. Hieraus ergibt sich eine Datenbasis von 
31 Personen (6 weiblich, 25 männlich) im Alter von 19 bis 52 Jahren (Mittelwert 24,88 Jahre, 
Standardabweichung 7,65 Jahre). Die Ergebnisse werden im Rahmen der gleichen Unterglie- 
derung wie im vorherigen Experiment präsentiert. Zunächst werden die resultierenden Fahr- 
zeugtrajektorien gezeigt. Auf Basis dieser Trajektorien erfolgen im Anschluss die Berechnung 
der Kenngrößen und die Tests der Hypothesen. Am Ende des Abschnitts wird der Transitions- 
prozess für die untersuchten Methoden betrachtet und der Ablauf des Manövers anhand von 


einzelnen Versuchspersonen direkt gegenübergestellt. 
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Fahrzeugtrajektorien 


Die Fahrzeugschwerpunkttrajektorien der gewerteten Versuchsdurchgänge mit der zeitbasier- 
ten Vorgabe des Transitionsverlaufs sind in Abbildung 5.30, die mit der automatisierten Adap- 
tion in Abbildung 5.31 dargestellt. Es sei erneut auf die Verzerrung durch die Darstellung von 
14m in Querrichtung gegentiber 450 m entlang der Fahrbahn hingewiesen. Im Fall der zeitba- 
sierten Transition führen alle Probanden das Ausweichmanöver erfolgreich ohne Kollision mit 
dem Hindernis oder der Schutzplanke durch. Bei den Versuchsfahrten mit adaptiertem Tran- 
sitionsverlauf gelingt das einer Versuchsperson nicht, wobei sich auch in diesem Versuch der 
Kontakt mit einem anderen Objekt nicht auf die Simulation auswirkt. Betrachtet man die Tra- 
jektorien im Bereich vor dem Hindernis genauer, erkennt man zudem, dass die Spurwechsel in 
der zeitabhängigen Transition etwas früher beginnen und über eine größere Distanz durchge- 
führt werden. Im Fall der in Abhängigkeit vom Fahrermoment adaptierten Transition erfolgen 
die Spurwechsel tendenziell später, aber über eine kürzere Distanz. Die Auswirkungen der ver- 


schiedenen Transitionsmethoden auf die Kenngrößen zeigt der nächste Abschnitt. 
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Abbildung 5.30: Fahrzeugschwerpunkttrajektorien aller Probanden fiir die Versuchsdurchgänge mit zeitbasiertem 
Transitionsverlauf 
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Abbildung 5.31: Fahrzeugschwerpunkttrajektorien aller Probanden für die Versuchsdurchgänge mit adaptivem 
Transitionsverlauf 
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Kenngrößen und statistischer Vergleich 


Wie zuvor erfolgt der quantitative Vergleich der beiden Methoden mit Hilfe der Kenngrößen 
zur Bewertung des Kollisionsrisikos und des fahrdynamischen Zustands des Fahrzeugs. Die 
Mittelwerte und Standardabweichungen sowie ausgewählte Einzelergebnisse werden nachfol- 
gend angeben, vollständige Tabellen mit den genauen Ergebnissen jedes Probanden für beide 


getesteten Konzepte befinden sich in Anhang A.3 


Die minimale Time-to-Collision K, beträgt für die zeitbasierte Transition im Mittel über alle 
Versuchsteilnehmer 1,676 s bei einer Standardabweichung von 0,537 s. Insgesamt unterschrei- 
tet K bei fünf Probanden den Wert von 1s. Der geringste Wert eines Probanden liegt für 
diese Methode bei 0,336 s. Die Ergebnisse für das Adaptionsverfahren sind nahezu identisch. 
Der Mittelwert ist mit 1,616s etwas geringer und die Standardabweichung mit 0,564 s etwas 
höher. In dieser Konfiguration unterschreiten nur vier Probanden eine Zeitlücke von 1s, je- 
doch liegt der Extremwert mit nur 0,273 s niedriger als zuvor. Der geringe Unterschied wirkt 
sich auch auf den statistischen Test aus. Die Nullhypothese, dass der Mittelwert bei Verwen- 
dung der adaptiven Transition geringer als bei Verwendung der zeitbasierten Transition ist, 
kann nicht abgelehnt werden (p = 0,5614). Durch diesen p-Wert können die beiden Verfahren 
als statistisch gleich angesehen werden. Eine grafische Darstellung des statistischen Vergleichs 
zeigt Abbildung 5.32. 


Die Ergebnisse der statistischen Auswertung für die zweite Kenngröße, den minimalen Ab- 
stand zu anderen Objekten Kg, zeigt Abbildung 5.33. Bei Verwendung des rein zeitabhängigen 
Transitionsverlaufs ergibt sich ein Mittelwert von 1,496 m (Standardabweichung 0,348 m). Drei 
Fahrer verlassen mit dieser Methode die linke Spur während des Passierens des Hindernisses. 
Mit einer Annäherung bis auf 0,534 m zum Hindernis überschreiten sie die 1m vom Verkehrs- 
objekt entfernt liegende Spurmarkierung zum Teil deutlich. Wie bei der vorherigen Kenngröße 
liefern auch hier die Fahrten mit adaptiver Transition mit 1,381 m einen kleineren Wert und die 
Standardabweichung ist höher (0,427 m). Bei diesem Transitionskonzept verlassen ebenfalls 
drei Teilnehmer die Zielspur, wobei einer von ihnen auch bei dem anderen Versuchsdurch- 
gang die Spur verließ. Zwei überschreiten die Spurmarkierung in Richtung des Hindernisses 
(minimaler Abstand 0,528 m), der dritte in Richtung der Schutzplanke, mit der er mit einem 
Abstandswert von -0,033 m sogar kollidiert. Der t-Test liefert für diese Kenngröße einen Wert 
von 0,8910 und folglich findet keine statistisch signifikante Erhöhung des Abstands durch die 


adaptive Transitonsmethode statt. 


Die Auswertung von Ka gibt Auskunft darüber, inwiefern die Probanden mit einer konstan- 
ten Querposition am Hindernis vorbei fahren oder ob sie durch zusätzliche Querbewegungen 
einen größeren Anteil der Spur benutzen (siehe Abbildung 5.34). Mit einem Mittelwert von 
1,992 m bei einer Standardabweichung von 0,315 m ergibt sich ein schmaler Korridor, in dem 


die Probanden bei zeitbasierter Vorgabe des Transitionsparameters das Hindernis passieren. 
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Abbildung 5.32: Statistischer Vergleich der mini- Abbildung 5.33: Statistischer Vergleich des mini- 


malen Zeitlücke zur Kollision K; malen lateralen Abstands Kg zu 

zwischen zeitbasiertem und adap- anderen Objekten zwischen zeit- 

tivem Transitionsverlauf basiertem und adaptivem Transiti- 
onsverlauf 


Auch für den Fahrer, der für dieses Konzept mit einem Wert von 2,800 m den meisten Platz 
in Querrichtung benötigt, reicht theoretisch die Spurbreite von 4m aus. Er orientiert sich je- 
doch bei diesem Manöver zu weit nach rechts, wodurch er einer der Teilnehmer ist, welche die 
Begrenzung zur Mittelspur überfahren. Die Versuchsdurchgänge mit der momentenbasierten 
Adaption der Transition erzielen im Mittel für Ka einen Wert von 2,144 m mit einer Standard- 
abweichung von 0,602 m. Den Maximalwert erreicht hier mit 4,143 m der Proband, der über 
die linke Spur hinausfährt und eine Kollision mit der Schutzplanke hervorruft. Er weicht somit 
nicht nur weitläufig aus, sondern benötigt auch viel Platz um das Fahrzeug im Korridor zwi- 
schen Schutzplanke und Hindernis zu stabilisieren. Mit einem p-Wert von 0,8841 kann, wie für 
die beiden vorherigen Kenngrößen bereits auch, die Nullhypothese einer Verbesserung, d.h. in 
diesem Fall einer Verringerung der Kenngröße, durch die zeitbasierte Transition anhand der 
Stichprobenmittelwerte nicht abgelehnt werden. 


Wie Abbildung 5.35 zeigt, liegen auch in der maximalen Querbeschleunigung Ka die Werte für 
das adaptive Verfahren im Mittel über denen des Verfahrens, bei dem die Transition nicht ange- 
passt wird. Für den adaptiven Verlauf ergibt sich ein Mittelwert von 3,946 m/s? bei einer Stan- 
dardabweichung von 1,805 m/s? gegenüber einem Mittelwert von 3,112 m/s? beim zeitbasier- 
ten Verlauf (Standardabweichung 1,676 m/ s?). Auch wenn die Maximalwerte mit 7,901 m/s? für 
die zeitbasierte Methode und 8,030 m/s? für die adaptierte Methode nicht weit auseinanderlie- 
gen, überschreiten im ersten Fall sieben Probanden den als Komfortgrenze betrachteten Wert 


von 4m/s*, wohingegen im zweiten Fall elf Personen eine höhere Querbeschleunigung wäh- 
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Abbildung 5.34: Statistischer Vergleich des Platz- Abbildung 5.35: Statistischer Vergleich der ma- 


bedarfs auf der Ausweichspur Ka ximalen Querbeschleunigung Ka 
zwischen zeitbasiertem und adap- zwischen zeitbasiertem und adap- 
tivem Transitionsverlauf tivem Transitionsverlauf 


rend des Ubergabevorgangs erzeugen. Auch für diese Kenngröße kann die Nullhypothese, dass 
das zeitbasierte Verfahren bessere, d.h. hier kleinere Werte erzeugt, nicht abgelehnt werden. 
Der hohe p-Wert von 0,9816 zeigt jedoch, dass die entgegengesetzte Hypothese ux,z > HKaa 
mit einer Irrtumswahrscheinlichkeit von nur p = 0,0184 abgelehnt werden kann. Hierdurch 
ist die Annahme gerechtfertigt, dass das adaptive Verfahren zu höheren maximalen Querbe- 
schleunigungen führt. 


Als letzte Kenngröße wird mit Ky der mittlere absolute Fehler der Querposition zur Referenz 
betrachtet. Die statistischen Kennzahlen für diese Größe zeigt Abbildung 5.36. Wird die Tran- 
sition zeitbasiert vorgegeben, beträgt die Distanz zur Referenztrajektorie im Mittel 0,418 m bei 
einer Standardabweichung von 0,174 m. Der Maximalwert eines Probanden liegt bei 0,708 m. In 
dieser Kenngröße liefert das adaptive Verfahren im Mittel bessere Werte. Der Mittelwert über 
alle Probanden beträgt hier nur 0,293 m und ist damit 0,125 m kleiner als für die Versuchs- 
durchgänge mit zeitbasierter Vorgabe der Transition (Standardabweichung 0,153 m). Auch der 
maximale Wert für einen Probanden fällt mit 0,616 m geringer aus. Die Anwendung des t-Tests 
ergibt, dass die Verringerung des Abstands statistisch sehr signifikant ist (p = 0,0017). Die Pro- 
banden folgen der Vorgabe bei einer Anpassung des Transitionsparameters an das von ihnen 
gestellte Lenkmoment also besser. Eine Zusammenfassung aller Ergebnisse des statistischen 
Vergleichs von zeitbasiertem und adaptivem Transitionsverlauf zeigt Tabelle 5.4. 
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Abbildung 5.36: Statistischer Vergleich der mittleren absoluten Querabweichung zur Referenz Ky zwischen zeitba- 
siertem und adaptivem Transitionsverlauf 


Tabelle 5.4: Ubersicht der Ergebnisse des statistischen Vergleichs von zeitbasiertem und adaptivem Transitionsver- 
lauf 


Nullhypothese Ho p-Wert Signifikanzniveau 


HK. 2 HK,,a 0,5614 nicht signifikant 
HK yz = HKya 0,8910 nicht signifikant 
UK yz < UK ya 0,8841 nicht signifikant 
HKaz < HKa,a 0,9816 nicht signifikant 
HKy.z < HKy,a 0,0017 sehr signifikant 


Ablauf des Transitionsprozesses 


Zur weiterführenden Analyse werden zunächst die Verläufe der Transitionsparameter bei bei- 
den Methoden miteinander verglichen. Abbildung 5.37 zeigt den Parameter a4 während der 
Transitionsphase für die zeitbasierte Transition. Es ist deutlich zu erkennen, dass eine große 
Bandbreite für den Beginn der Transitionsphase besteht. Die Zeitpunkte, zu denen erstmalig 
eine Hand der Probanden am Lenkrad erkannt wird, variieren von 1,8 s bis 4,3 s. Ab da fällt der 
Transitionsparameter in der Art linear ab, dass er zum Zeitpunkt 6s nach der Übernahmeauf- 
forderung den Wert 0 erreicht hat. Die Verzögerung durch die nicht exakte Zeitsynchronisa- 
tion bleibt wie beim Vorgängerexperiment bestehen, was am nicht perfekt linearen Verlauf 
zu erkennen ist. Im Gegensatz zum ersten Fahrsimulatorexperiment ist der Transitionspara- 
meter wie geplant 6 s nach der Übernahmeaufforderung jetzt für alle Versuchspersonen gleich 
0 (bzw. durch die Verzögerung fast 0), sodass die Transitionsphase abgeschlossen ist und kein 


Moment mehr von der Automation an das Lenkrad gestellt wird. Da kein Proband mehr als 5 s 
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zur Übernahme der Lenkrads benötigt, musste die Notabschaltung, welche a4 innerhalb der 
letzten Sekunde vor dem Endzeitpunkt auf 0 überführt, für dieses Transitionsverfahren nicht 


aktiv werden. 
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Abbildung 5.37: Verlauf des Transitionsparameters für alle Probanden bei Verwendung der zeitbasierten Transiti- 
onsmethode 


Erfolgt der Verlauf des Transitionsparameters basierend auf dem Adaptionsverfahren aus Ka- 
pitel 4, ergibt sich ein ungleichmäßigerer Verlauf der in Abbildung 5.38 zu sehen ist. Die Tran- 
sitionsphase beginnt hier zwischen 1,1s und 4,3s nach Beginn der Aufforderung, wobei in 
diesem Fall aus der Hands-On-Erkennung nicht automatisch eine Änderung des Transitions- 
parameters folgt. Stattdessen sinkt der Parameter erst, wenn die Lenkreaktion des Menschen 
zum Modell mit dem entsprechenden Transitionsparameter passt. An den Kurven ist erkenn- 
bar, dass das Absinken von a, stufenweise geschieht. Dabei ist zu beachten, dass nur redu- 
zierende Schritte im Algorithmus zugelassen wurden. Nur bei vier Probanden wird der Tran- 
sitionsparameter alleine durch die Adaption bis auf den Wert 0 abgesenkt. Bei den übrigen 
Teilnehmern wird die Übergabebegrenzung aktiv, welche 5s nach der Übernahmeaufforde- 
rung einen linearen Abfall über 1s erzwingt. Bei 17 von diesen erfolgt zuvor zumindest eine 
teilweise Reduktion durch die Adaption. Für die übrigen zehn wird im gesamten Übergabe- 
prozess keine Lenkreaktion ermittelt, welche eine Reduktion der Unterstützung aus Sicht des 
Systems rechtfertigt und die Übergabe bis zum Endzeitpunkt einzig durch das Abschaltkonzept 
erzwungen. Im linearen Verlauf der Abschaltung erkennt man, dass auch für dieses Konzept 


kleine Verzögerungen in der Kommunikation zwischen Regler und Fahrsimulator auftreten. 


Details zur unterschiedlichen Wirkungsweise der untersuchten Methoden lassen sich aus dem 
direkten Vergleich bei einzelnen Probanden erkennen. Es wurden hierfür zwei Versuchsperso- 
nen als Beispiele ausgewählt, bei denen die Transitionsphase für beide Methoden annähernd 


zeitgleich beginnt. 


In Abbildung 5.39 sind die Fahrzeugtrajektorie sowie die Verläufe des Transitionsparameters 


und der Stellgrößen von Mensch und Automation während der Transitionsphase für beide Ver- 
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Abbildung 5.38: Verlauf des Transitionsparameters für alle Probanden bei Verwendung der adaptiven Transitions- 
methode 


suchsdurchgänge von Versuchsperson 30 dargestellt. Die Transitionsphase beginnt in beiden 
Fällen ca. 80 m nach der Übernahmeaufforderung. Bei der Fahrt mit dem zeitbasiert vorgegebe- 
nen Transitionsverlauf lenkt die Versuchsperson stark nach links, um den Spurwechsel durch- 
zuführen. Damit weicht sie von dem für sie modellierten Verhalten deutlich ab. Der Regler rea- 
giert, indem er ein entgegengesetztes Moment aufbringt, um das Fahrzeug auf die vorgegebene 
Solltrajektorie zu bringen. Durch das höhere Lenkmoment des Menschen wird die Automati- 
on überstimmt und der Spurwechsel auf einem Pfad links der Referenz durchgeführt. Durch 
Abnahme des Transitionsparameters über der Zeit und die Annäherung an die Referenztra- 
jektorie reduziert sich auch das Moment der Automation. Auch beim Versuchsdurchgang mit 
der adaptierten Transitionsphase wird dem menschlichen Lenkmanöver nach links durch ein 
Gegenmoment der Automation entgegen gewirkt. Anders als zuvor, überstimmt der Fahrer 
diesmal die Automation nicht, sondern lässt sich auf die Referenztrajektorie führen. Sobald er 
nicht mehr von der Zielvorgabe weg, sondern auf diese zu lenkt, vermindert die Adaption den 
Transitionsparameter. Auf diese Art erreicht a einen Wert von 0,28, bevor der verbleibende 
Teil über die Übergabebegrenzung auf 0 reduziert wird. Insgesamt führt diese Versuchsper- 
son mit beiden Verfahren ein sicheres Ausweichmanöver durch, wobei sie sich bei der ersten 
Variante zwar weiter von der Referenz entfernt ist (Ky = 0,325 m gegentiber 0,117 m), durch 
die flachere Trajektorie jedoch auch geringere Querbeschleunigungen erreicht (2,103 m/s? im 
Vergleich zu 3,351 m/s”). 


Wie an den Verläufen der Transitionsparameter in Abbildung 5.38 zu erkennen ist, gibt es 
zehn Probanden, die keinen Adaptionsvorgang auslösen. Ein Beispiel hierfür ist Testperson 
24. Fahrzeugtrajektorien, Transitionsparameter und Stellgrößen von Mensch und Automation 
sind für die beiden Fahrten dieser Versuchsperson in Abbildung 5.40 dargestellt. Wie im vor- 
herigen Beispiel lenkt auch diese Person bei Verwendung des vorgegebenen Transitionsver- 


laufs umgehend nach der Übernahme nach links, um den Spurwechsel einzuleiten. Ebenfalls 
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Abbildung 5.39: Ubergabesituation von Versuchsperson 30 für den zeitbasierten (grün) und den adaptiven (blau) 
Transitionsverlauf. Die vertikalen Linien geben Start und Ende der jeweiligen Transitionsphase an. 
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wie zuvor hält die Automation dagegen, da die Referenzvorgabe einen späteren Spurwechsel 
vorsieht. Da die Versuchsperson hier ein höheres Lenkmoment aufbringt, erhöht sich auch 
die Gegenkraft, welche erst durch die Beschränkung auf maximal 2Nm begrenzt wird. Erst 
mit Annäherung an die Referenz und der Reduktion des Transitionsparameters über der Zeit 
sinkt die Stellgröße der Automation, sodass der Fahrer auch mit geringerem Kraftaufwand 
den Spurwechsel auf dem von ihm beabsichtigten Pfad durchführen kann. Im Gegensatz zum 
vorherigen Beispiel zeigt diese Person bei Verwendung der adaptiven Transitionsphase ein 
ähnliches Verhalten wie beim vorgegebenen Übergabeverlauf. Auch hier stellt der Proband 
ein Lenkmoment, welches das Fahrzeug früh nach links und so von der Solltrajektorie weg 
bewegt. Der Regler reagiert analog zum anderen Konzept und versucht, das Fahrzeug wieder 
in Richtung der Referenz zu manövrieren. Der Transitionsparameter wird während des gesam- 
ten Übergabeprozesses nicht durch die Adaption gesenkt, weil die Aktion des Fahrers nicht zu 
einer Annäherung an die Zielvorgabe führt. Da sich in diesem Beispiel der Versuchsteilnehmer 
als ebenso unnachgiebig wie die Automation erweist, arbeiten beide über einen langen Zeit- 
raum gegeneinander, wobei sich der menschliche Partner aufgrund die Stellgrößenbeschrän- 
kung des Reglers letztendlich durchsetzt. Erst 161 m nach der Übernahmeaufforderung führt 
die Übergabebegrenzung, die nach 5s aktiv wird, zum graduellen Abschalten der Automati- 
on. Zusammen mit der Annäherung an die Referenz wird u, verringert und auch der Fahrer 
kann seinen Stellaufwand verkleinern. Die Kenngrößen dieses Probanden passen zu den Test- 
ergebnissen. In allen Kategorien außer dem mittleren Abstand zur Referenz erweisen sich die 
Ergebnisse für die zeitabhängige Transition als besser. Die Verbesserungen für K,, Kg und Ky 
sind jedoch nur marginal, während die maximale Querbeschleunigung Ka über 1m/s? gerin- 
ger ist als im Fall der auf dem Fahrermoment basierenden Adaption. Die Leistung im Folgen 
der Referenz fällt hier nur geringfügig besser aus, jedoch ließen sich andere Probanden, wie 
beispielsweise der Proband aus dem vorherigen Absatz, eher von der Automation leiten und 


sich so besser auf die Solltrajektorie führen. 


Abschließend werden noch zwei Besonderheiten bei Versuchsdurchgängen mit Nutzung des 
adaptiven Verfahrens gezeigt. Hierzu wird einerseits Versuchsperson 19 als ein repräsenta- 
tiver Proband aus der Gruppe der Versuchspersonen, die deutlich vor Ablauf der maximalen 
Übergabezeit die Fahrzeugführung vollständig übertragen bekommen haben, ausgewählt. An- 
dererseits wird ein genauerer Blick auf den einzigen Versuchsteilnehmer geworfen, der trotz 
kooperativer Transitionsphase eine Kollision mit der Schutzplanke nicht vermeiden konnte 
(Proband 2). Die Verläufe von Querpositionen, Transitionsparametern und Stellgrößen für die 


beiden Versuchsdurchgänge werden gemeinsam in Abbildung 5.41 dargestellt. 


An der Fahrzeugtrajektorie ist zu erkennen, dass der Proband 19 der Referenztrajektorie sehr 
gut folgt und im mittleren Bereich des Spurwechsels diese nahezu ideal abfährt. Dieses Verhal- 
ten kann vom Modell nur durch einen hohen Transitionsparameter für den Menschen erklärt 
werden, woraufhin die Automation im Sinne der Einhaltung der idealen Transition ihren Tran- 


sitionsparameter schnell reduziert und somit bereits ab der Hälfte des Spurwechselmanövers 
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Abbildung 5.40: Ubergabesituation von Versuchsperson 24 für den zeitabhängigen (grün) und den adaptiven (blau) 
Transitionsverlauf. Die vertikalen Linien geben Start und Ende der jeweiligen Transitionsphase an. 


124 5 Experimentelle Validierung 


g i m 
= 10} | ee ne | 
E set 5 aa : n se 
Q | i 
a BEE SEE re 
Q 0 50 100 150 20 250 300 350 400 
Streckenmeter in m 
(a) Fahrzeugschwerpunkt- (farbig) und Referenztrajektorien (schwarz gestrichelt) 
u T 
un no, i | 
> 0.5 - ! ! 4 
°F | | | | | | | | o] 
0 50 100 150 200 250 300 350 400 
Streckenmeter in m 
(b) Transitionsverläufe 
DI TT 
2 F = 
3 | | 
E 0 S | — 
S =D | I I | 
Ei | | | | | 
0 50 100 150 200 250 300 350 400 
Streckenmeter in m 
(c) Lenkmomente der Automation während der Transitionsphase 
4 


er a j l | 
I 


um in Nm 
| 

i 

N 
J 


| | il | | | | 
0 50 100 150 200 250 300 350 400 
Streckenmeter in m 
(d) Lenkmomente der Probanden 


Abbildung 5.41: Besonderheiten der Adaption in den Übergabesituationen von Versuchsperson 2 (dunkelblau) und 
Versuchsperson 19 (hellblau). Die vertikalen Linien geben Start und Ende der jeweiligen Transi- 
tionsphase an. 
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kein Moment mehr auf das Lenkrad aufbringt. Da ein erneuter Anstieg von a im System nicht 
zugelassen wurde, musste der Proband den Spurwechsel alleine beenden und erzeugt hier- 
bei einen leichten Überschwinger beim Stabilisieren auf der linken Spur. Der zweite Proband 
zeigt das andere Extrem. Er folgt dem von der Automation vorgeschlagenen Spurwechsel lan- 
ge Zeit nicht und hält das Lenkrad gerade, indem er dem maximalen Moment des Systems von 
2Nm mit einem betragsmäßig identischen Moment entgegenwirkt. Erst in dem Bereich, in 
dem der Transitionsparameter bereits zwangsweise reduziert wird, um eine Übergabe 6 s nach 
der Aufforderung sicher zu stellen, lenkt der Proband scharf nach links und fährt knapp vor 
dem Hindernis auf die linke Spur. Der Regler versucht dieses Manöver noch durch ein entge- 
gengesetztes Moment abzumildern, gelangt jedoch auch in diese Richtung in die Begrenzung 
bei -2 Nm und schaltet kurz darauf graduell ab, da die maximale Ubergabezeit erreicht ist. Der 
Fahrer ist anschließend nicht in der Lage, den von ihm stark initiierten Spurwechsel rechtzeitig 


auf der Zielspur abzufangen und kollidiert daher mit der Schutzplanke. 


5.3.3 Interpretation und Zusammenfassung 


Fasst man die Ergebnisse des Experiments zusammen, ergibt sich auf dem ersten Blick ein wi- 
dersprüchliches Bild. So erzielt die Adaption des Transitionsparameters geringere Abweichun- 
gen von der Referenztrajektorie, verursacht jedoch gleichzeitig höhere Werte für die maximale 
Querbeschleunigung während des Ausweichmanövers im Vergleich mit der rein zeitbasierten 
Transition. Für die Kenngrößen minimale Zeitlücke zur Kollision K-, minimaler lateraler Ab- 
stand Ky und dem benötigten Raum auf der Ausweichspur Ka ergibt die Stichprobe im Mittel 
ebenfalls leicht schlechtere Werte für das Adaptionsverfahren, wobei die jeweiligen Unter- 
schiede statistisch nicht signifikant sind. Insgesamt erfüllt das assistierende System bei Nut- 
zung der Adaption die Aufgabe der Referenz zu folgen besser, erzeugt jedoch in allen anderen 


objektiven Kriterien zur Bewertung des Spurwechsels schlechtere Ergebnisse. 


Die Betrachtung der gewählten Ausweichtrajektorien erklärt den vermeintlichen Widerspruch. 
Verläuft die Transition zeitbasiert, beginnen die Versuchspersonen früher damit, das Fahrzeug 
nach links zu führen. Damit arbeiten sie zwar gegen das System, dessen Gegenmoment nimmt 
jedoch aufgrund des vorgegebenen Transitionsverlaufs über die Zeit ab. Wird der Transitions- 
parameter alternativ über die Adaption aus dem aktuellen Lenkmoment des Fahrers bestimmt, 
findet im Falle eines Abweichens von der Referenztrajektorie keine Anpassung statt. Das Ma- 
növer entgegen der Zielvorgabe wird als fehlende Übernahmebereitschaft des Fahrers inter- 
pretiert und somit keine Kontrolle von der Automation abgegeben. Um das System trotzdem 
zu überstimmen, muss vom Menschen folglich über eine längere Zeit ein größeres Moment 
aufgebracht werden. Durch das höhere Moment der Automation bei Abweichungen von der 
Referenz werden die Probanden stärker an die Vorgabe herangeführt und setzen ihren initial 
beabsichtigten Spurwechselverlauf weniger deutlich durch. Da der Referenzspurwechsel spä- 


ter, dafür aber über einer kürzeren Distanz verläuft, wird das Fahrzeug, im Vergleich zu einem 
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früher begonnenen, flacheren Spurwechsel, bei Abfahren der Vorgabe auch höheren Quer- 
beschleunigungen ausgesetzt. Die steilere Einfahrt in die Zielspur erschwert es dem Fahrer 
zudem, das Fahrzeug auf der neuen Spur zu stabilisieren, wodurch die geringeren Abstände 
zur Schutzplanke bzw. zum Hindernis und der leicht erhöhte, zum Stabilisieren benötigte, Platz 
erklärbar sind. Der exakte Wunschspurwechselverlauf der Versuchsteilnehmer bleibt jedoch 
unklar, da auch die Variante mit vorgegebenem Verlauf vom Moment des Assistenzsystems 
beeinflusst ist. Es sei außerdem erneut darauf hingewiesen, dass das Experiment an einem 
statischen Fahrsimulator durchgeführt wurde und sich die aus den Manövern ergebenden Be- 
schleunigungen nur auf die Simulation auswirken, aber für den Probanden nicht spürbar sind. 
Die Wahrnehmung der Beschleunigungen im realen Fahrzeug könnte die Wahl der Solltrajek- 
torie beeinflussen. Der Vergleich mit den Trajektorien der unassistierten Versuchsdurchgänge 
des ersten Experiments legt die Einschätzung nahe, dass die Probanden lediglich eine starke 
Ausweichreaktion zeigen und somit hier erst durch das Assistenzmoment auf eine flachere 
und besser kontrollierbare Trajektorie geführt werden. Mit der adaptiven Transitionsmetho- 
de wird dagegen das Folgen der Referenzvorgabe stärker durchgesetzt. Hierdurch wird das 
Spurwechselmanöver etwas verzögert und der Fahrer hat mehr Zeit, die Situation zu erfassen, 


bevor eine möglicherweise überstürzte Aktion umgesetzt wird. 


Dass die Versuchspersonen nicht der Solltrajektorie des Reglers folgen, zeigt sich auch am 
Verlauf des Transitionsparameters, welcher bei einem Großteil der Teilnehmer nicht oder nur 
geringfügig durch die Adaption beeinflusst wird. Eine erweiterte Sollwertgenerierung, welche 
die Zieltrajektorie an die verbleibende Zeit anpasst, anstatt einen festen Verlauf zu erzwingen, 
könnte hier sowohl den Adaptionsverlauf als auch die Kenngrößen verbessern. Idealerweise 
würden die Präferenzen des Fahrers erkannt bzw. aus vorherigen Manövern erlernt und dar- 
aus der Sollwertverlauf individuell auf diesen zugeschnitten. Das Experiment zeigt auch, dass 
der Grad, mit dem ein Folgen der Referenz durchgesetzt wird, stark vom Vertrauen in die Qua- 
lität der Referenz abhängen sollte. Ist sich das System mit der Notwendigkeit der Einhaltung 
der Vorgabe sicher, ist es vorteilhaft die Aufgabe nur dann zu übergeben, wenn der Mensch 
ebenfalls der Vorgabe folgt. Andernfalls führt die Automation auf einen suboptimalen Pfad. 
Für den menschlichen Partner wäre in diesem Fall ein fest vorgegebener, gradueller Überga- 
beverlauf sinnvoller, da er so seine eigenen Interessen leichter durchsetzen kann. Dass die 
Anleitung des Menschen über haptische Interaktion nicht uneingeschränkt funktioniert, zeigt 
der Proband mit der Nummer 2, der sich trotz dauerhaft hohen Moments in Ausweichrichtung 
über die Automation hinwegsetzt und weiter auf das Hindernis zufährt. Die Intensität, mit der 
die Automation ihre Absicht über den haptischen Kanal kommuniziert, könnte zwar leicht er- 
höht werden, eine Steigerung des maximalen Moments geht jedoch auch mit dem Risiko des 
Verlusts der Übersteuerbarkeit oder einem möglicherweise noch höheren Gradienten des un- 
terstützenden Moments beim Abschalten einher. Das Experiment zeigt weiterhin, dass mit der 
adaptiven Transitionsmethode die Fahraufgabe bereits deutlich vor Erreichen des Zeitpunktes, 


an dem die Automation spätestens deaktiviert sein muss, vollständig übergeben werden kann, 
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wenn der Fahrer zu Beginn der Referenz ausreichend gut folgt. Fiir diese Probanden kann so 


der Ubergabeprozess schneller abgeschlossen werden. 


Insgesamt ergibt der Vergleich der rein zeitbasierten Transition und einer adaptiven Transi- 
tion anhand einer aktionsbasierten Schätzung des Ubergabeparameters, dass nur ein geringer 
Unterschied zwischen den Konzepten besteht und beide für eine sichere Übergabe der Fahr- 
zeugführung gut geeignet sind. Die geringen Abstände zur vorgegebenen Trajektorie für das 
adaptive Transitionsverfahren zeigen dessen hohes Potenzial, den Menschen in eine vordefi- 
nierte Richtung zu führen. Je nach Wahl der Referenztrajektorie kann dieses Verfahren somit 


überlegen sein. 


5.4 Gesamtergebnis und Bewertung 


Die drei Experimente zeigen die Vorteile einer haptischen Unterstützung des Menschen bei 
der Übernahme einer Aufgabe von einer Automation. Der Vergleich verschiedener gradueller 
Transitionskonzepte mit Methoden, welche die Aufgabe in einem Schritt vollständig überge- 
ben, zeigt im ersten Experiment, dass der Erfüllungsgrad der Aufgabe während der Transition 
bei den graduellen Konzepten höher ist. Erfolgte das direkte Abschalten sehr früh, reduzier- 
te sich der Erfüllungsgrad stark, was eine noch nicht vorhandene Übernahmebereitschaft der 
Probanden indiziert. Aber auch wenn die Funktion erst spät im Verlauf des Übernahmeprozes- 
ses in einem Schritt deaktiviert wurde, konnten die Versuchspersonen den Wegfall des Anteils 
der Automation an der Aufgabe nicht instantan kompensieren. Im Gegensatz dazu werden die 
Probanden bei den graduellen Konzepten langsam an die neue Aufgabe herangeführt und wäh- 
renddessen weiterhin, jedoch mit der Zeit immer geringer, durch die Automation unterstützt. 
Diese Unterschiede erklären neben der verbesserten Leistung auch die bessere subjektive Be- 
wertung durch die Versuchsteilnehmer für diese Konzepte. Das in dieser Arbeit vorgestellte 
Übergabekonzept basierend auf zeitvarianten Differentialspielen lieferte die besten Ergebnis- 
se, weshalb die Methode als Grundlage für die kooperative Transition in den weiteren Expe- 


rimenten verwendet wurde. 


Während die Aufgabe im ersten Experiment in eine vereinfachte Experimentalumgebung ein- 
gebettet und die optimale Lösung eindeutig definiert war, zeigt das zweite Experiment, dass 
die verbesserte Leistung auch bei realen Anwendungen und damit komplexeren Systemen und 
Szenarien erwartet werden kann. Im Experiment wurde eine Übernahmesituation am Ende ei- 
ner hochautomatisierten Fahrt abgebildet. Die Probanden werden unerwartet zur Übernahme 
der Fahrzeugführung aufgefordert und müssen nach links ausweichen, um eine Kollision mit 
einem sich vor ihnen befindenden Hindernis zu vermeiden. Diese anspruchsvolle Fahrsituati- 


on lässt sich nicht mehr anhand einer einzigen klar definierten Größe bewerten. Stattdessen 
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werden die vier Kenngrößen minimale Zeitlücke bis zur Kollision in Längsrichtung, minima- 
ler seitlicher Abstand zu anderen Objekten, Ausmaß der Querbewegung auf der Ausweichspur 
und maximale Querbeschleunigung definiert. Diese Kenngrößen werden zur Bewertung der Si- 


cherheit und des potenziellen Unfallrisikos während des Ausweichmanövers herangezogen. 


Das Experiment zeigt in allen vier Kenngrößen verbesserte Werte für den Fall, dass die Tran- 
sition kooperativ erfolgt. Außer für die maximale Querbeschleunigung sind die Verbesserun- 
gen statistisch signifikant. Durch die haptische Interaktion während der kooperativen Transi- 
tion werden sowohl Fahrer, die verspätet reagieren, zum Ausweichmanöver animiert als auch 
Überreaktionen durch entsprechende Gegenmomente abgemildert. Die kritische Fahrsituation 
kann so deutlich entschärft werden und ist für alle Versuchsteilnehmer sicher durchführbar. 
Ohne Unterstützung treffen die Probanden die Entscheidung zum Spurwechsel teilweise später 
als wenn sie bereits durch ein Moment dazu angeleitet werden. Zudem überschätzt ein Groß- 
teil die zum Ausweichen notwendige Aktion, wodurch das Stabilisieren des Fahrzeugs auf der 
neuen Spur erschwert wird und dies zwei Probanden nicht ohne Kollision mit der Schutzplanke 
gelingt. Diese Verhaltensweisen können als Folge eines mangelnden Situationsbewusstseins 


unmittelbar nach der Übernahmeaufforderung interpretiert werden. 


Die Ergebnisse für die Anwendung im hochautomatisierten Fahren stimmen insofern mit de- 
nen der Experimente aus den in Kapitel 2 vorgestellten Quellen überein, dass eine Übernah- 
meaufforderung 6s vor der potenziellen Kollision in einer kritischen Fahrsituation als un- 
zureichend betrachtet werden muss, falls die Übergabe direkt erfolgt. Zwar gelingt es allen 
Versuchspersonen rechtzeitig zu reagieren, jedoch können sechs von 31 Probanden den Spur- 
wechsel bei direkter Transition nicht sicher durchführen. Bei ihnen befindet sich das Fahrzeug 
auf Höhe des Hindernisses noch teilweise auf der Ausgangsspur oder es ist über die Zielspur 
hinaus gefahren. Eine frühere Warnung kann hier Abhilfe schaffen, da die Probanden so mehr 
Zeit haben sich auf die Übergabe vorzubereiten. Dies stellt jedoch wiederum höhere Anfor- 
derungen an die Sensorik für die Detektion der zur Übernahme führenden Situation. Mit der 
Unterstützung durch eine kooperative Transitionsphase verbessert sich bei fünf dieser sechs 
Probanden die Fahrzeugtrajektorie und die geringen Abstände zu den Kollisionsobjekten wer- 
den vermieden. Bis auf eine einzige Ausnahme sind so alle Probanden in der Lage, das Fahrzeug 
im Rahmen des knappen Zeitbudgets rechtzeitig in die Zielspur zu manövrieren und dort zu 
stabilisieren. Die kooperative Transitionsphase kann somit auch bei geringen Übernahmezei- 
ten einen sicheren Wechsel der Fahrzeugkontrolle zurück an den Menschen realisieren und 


somit hochautomatisiertes Fahren gegebenenfalls erst ermöglichen. 


Auch wenn die Ergebnisse der Experimente 2 und 3 aufgrund kleiner Modifikationen am Ver- 
suchsdesign sowie einer anderen Menge an Versuchspersonen nicht unmittelbar miteinan- 
der vergleichbar sind, lassen sich die Ergebnisse für die kooperative Transition qualitativ mit 
den beiden Transitionsmethoden aus dem dritten Experiment wiederholen. Unabhängig von 


der gewählten kooperativen Transitionsmethode zeigen die Spurwechseltrajektorien auch hier 
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Verbesserungen im Vergleich zu den unassistierten Fahrten aus dem zweiten Experiment. Ein- 
zig ein Fahrer, der sich der Unterstiitzung bis kurz vor dem Ende der Transitionsphase wider- 
setzt und dann doch noch einen schnellen Spurwechsel durchführt, kann das Szenario nicht 


unfallfrei beenden. 


Untereinander zeigt der Vergleich von einem rein zeitbasierten Übergabeverlauf mit einer 
adaptiven Transition, deren Verlauf an die Stellgröße des Menschen angepasst wird, im be- 
trachteten Szenario ein ähnliches Verhalten der beiden Verfahren. Die detaillierte Analyse er- 
gibt jedoch den Unterschied, dass das System mit der Adaption die Probanden dazu bewegen 
kann, der vorgeschlagenen Referenztrajektorie besser zu folgen. Im Fall einer zeitbasierten 
Transition können die Versuchspersonen dagegen einfacher alternativen Trajektorien nachge- 
hen und wählen im Testfall einen Verlauf mit geringerer Querbeschleunigung. Grundsätzlich 
ist der Fahrer bei entsprechender Beschränkung des assistierenden Moments jederzeit in der 
Lage, die Automation zu übersteuern und seinen eigenen Willen auch entgegen der Vorgabe 
durchzusetzen. Dennoch muss für eine sinnvolle Anpassung der Transition, abhängig von der 
Eigeninitiative des Fahrers der Referenz der Automation zu folgen, die Vorgabe auch zur Ab- 
sicht des Fahrers passen. Wird die Solltrajektorie entsprechend gewählt, kann die Eigenschaft 
der adaptiven Transition, die Spurfolgeleistung des Systems zu verbessern, optimal zu Komfort 


und Sicherheit während der Transition beitragen. 


Insgesamt zeigen die Experimente klar, dass der bisherige Stand der Technik, eine Aufgabe 
von der Automation abrupt an den Menschen zu übergeben, nicht sinnvoll ist. Stattdessen 
liefert das vorgestellte Konzept der kooperativen Transition auf Basis eines Differentialspiels 
eine Möglichkeit, diese Übergabe deutlich sicherer zu gestalten. Durch eine individuelle Adap- 
tion des Transitionsparameters kann die Einhaltung der Zielvorgabe noch weiter verbessert 


werden. 


6 Zusammenfassung 


Die vorliegende Arbeit befasst sich mit der Frage, wie ein Transfer einer Aufgabe zwischen 
Mensch und Maschine gestaltet werden kann, um die Qualität bzw. Sicherheit während des ge- 
samten Übergabeprozesses zu gewährleisten. Trotz gegenläufiger wissenschaftlicher Erkennt- 
nisse erfolgen bisherige praktische Umsetzungen häufig unter der Prämisse, der Mensch könne 
die Aufgabe sofort vollständig und sicher übernehmen. Hierdurch wird ein sofortiges Abschal- 
ten der Automation gerechtfertigt. Dies ist insbesondere dann nicht korrekt, wenn der Mensch 
unerwartet zur Übernahme aufgefordert wird und er die aktuelle Situation erst erfassen und 


verarbeiten muss. 


Um den Menschen in diesen Transitionsprozessen zu unterstützen, wird in dieser Arbeit ei- 
ne Übergabe auf der Grundlage des Konzepts Haptic Shared Control vorgeschlagen. Hierbei 
erfolgt der Wechsel der Kontrolle über die Aufgabe in einer Transitionsphase, in der die bei- 
den Partner gemeinsam mit dem System interagieren und über Kräfte bzw. Momente an der 
Stelleinrichtung wechselseitig miteinander kommunizieren. Bestehende Methoden, die dieses 
Prinzip auf Mensch-Maschine-Interaktionen mit wechselnden Rollen anwenden, sind zumeist 
heuristisch und/oder auf sehr eingeschränkte Anwendungsfelder ausgelegt. Weiterhin fehlen 
aussagekräftige Ergebnisse aus Experimenten, in denen die Verfahren tatsächlich in der Inter- 


aktion mit Menschen evaluiert werden. 


Um diese Forschungslücke zu schließen, wurde im Rahmen dieser Arbeit erstmalig ein Ansatz 
entwickelt, in dem die Interaktion zwischen Mensch und Maschine systematisch modelliert 
und im Reglerentwurf zur Gestaltung der Übergabe berücksichtigt wird. Dazu werden die bei- 
den Kooperationspartner als Optimalregler mit zeitvarianten Gütemaßen betrachtet und deren 
Zusammenarbeit über das spieltheoretische Konzept der Differentialspiele abgebildet. Das Ziel 
für die innerhalb dieses Frameworks modellierten Übergabeprozesse ist es, den Regler jeder- 
zeit so zu parametrieren, dass dieser optimal mit dem Menschen kooperiert und diesen gerade 
soweit unterstützt, wie zur reibungslosen Erfüllung der Aufgabe notwendig ist. Hierfür wur- 
den zwei Varianten zur Bestimmung des Transitionsverlaufs verfolgt: In der ersten Variante 
wird der Verlauf a priori modelliert und die Parameterwahl im Betrieb abhängig vom aktuel- 
len Zeitpunkt im Übergabeprozess getroffen. Im Gegensatz dazu wird in der zweiten Variante 
die Übernahmebereitschaft des Menschen zur Laufzeit ermittelt. Dazu wird die aktuelle Hand- 


lung erfasst und mit der erwarteten Reaktion aus dem Modell verglichen. Abhängig von der 
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Abweichung wird das Modell entsprechend adaptiert und die so geschatzte Leistungsfahig- 
keit des Menschen verwendet, um den passenden Grad der Unterstiitzung zu bestimmen. Die 
funktionelle Wirkungsweise konnte für beide Varianten erfolgreich in der Simulation bestätigt 


werden. 


Um die kooperativen Übergabemethoden valide zu bewerten, müssen reale Übergabesituatio- 
nen mit Menschen betrachtet werden. Hierzu wurden für diese Arbeit drei Experimente kon- 
zipiert und durchgeführt, welche erstmalig eine wissenschaftlich seriöse Analyse von Tran- 
sitionen via Haptic-Shared-Control erlauben. Im ersten Experiment konnte gezeigt werden, 
dass selbst für eine sehr einfache Aufgabe die Qualität der Übergabe bei einer unerwarte- 
ten Übernahmeaufforderung durch Ansätze mit einer Haptic-Shared-Control-basierten Tran- 
sitionsphase erhöht werden kann. Der neue Differentialspielansatz erzielt dabei von allen Kon- 
zepten die besten Ergebnisse. Diese Erkenntnisse bilden die Grundlage für die weitergehende 


Untersuchung der Eignung für Übernahmesituationen im hochautomatisierten Fahren. 


Die Validierung für diesen Anwendungsfall erfolgte in den beiden weiteren Experimenten, in 
denen das realistischere und deutlich komplexere Szenario der Übernahmeaufforderung einer 
hochautomatisierten Fahrfunktion an einer Systemgrenze im Fahrsimulator umgesetzt wurde. 
Im Vergleich von einer sofortigen und einer kooperativen Transition, welcher die Grundlage 
des zweiten Experiments bildet, können die Ergebnisse des ersten Versuchs bestätigt wer- 
den. Die kooperative Transition gestaltet das erforderliche Ausweichmanöver sicherer, da die 
Fahrer mit Unterstützung in der Lage sind, größere Abstände und Zeitlücken zu den ande- 
ren Objekten einzuhalten und das Fahrzeug mit geringerer Querbewegung auf der Zielspur 
zu stabilisieren. Müssen die Teilnehmer die Fahraufgabe sofort vollständig übernehmen, fehlt 
ihnen das nötige Situationsbewusstsein, was sich in späten und heftigen Reaktionen äußert, 
die für manche Probanden zur Kollision geführt hätten. Mit der direkten Übergabe ist es so- 
mit nicht möglich die Transition innerhalb des knappen Zeitrahmens sicher durchzuführen. 
Aus diesem Grund kann die kooperative Transitionsphase einen wichtigen Baustein für die 


Einführung hochautomatisierter Fahrfunktionen darstellen. 


Im dritten Experiment wurden die beiden in dieser Arbeit vorgestellten Varianten zur Bestim- 
mung des Transitionsverlaufs ebenfalls anhand eines Ausweichszenarios im Fahrsimulator 
miteinander verglichen. Die Versuchspersonen können in beiden Fällen die Situation hand- 
haben und dem Hindernis sicher ausweichen. Die Ergebnisse zeigen weiterhin, dass die Ver- 
suchspersonen über das adaptive Verfahren stärker in Richtung der Referenzvorgabe der Au- 
tomation geführt werden und so die Leistung im Folgen der Solltrajektorie weiter verbessert 


werden kann. 


Insgesamt belegen die Resultate der drei Experimente, dass der vorgestellte Ansatz der koope- 
rativen Transition nicht nur zur theoretischen Beschreibung des Übergabeprozesses geeignet 


ist, sondern auch in der Praxis einen realen Mehrwert erzielt. Die in dieser Arbeit entwickelten, 
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neuartigen Verfahren bilden die Möglichkeit einer systematischen Modellierung der Interak- 
tion und einer entsprechenden Auslegung der Unterstützung durch die Automation, welche 
zu performanten und sicheren Transitionen von Aufgaben zwischen Mensch und Maschine 
führt. Durch das universelle Konzept sind die entwickelten Methoden neben dem hier gezeig- 
ten Einsatz beim hochautomatisierten Fahren auch für die Anwendung auf anderen Gebieten 
der Mensch-Maschine-Interaktion, wie beispielsweise der Zusammenarbeit im Kontext von 


Mensch-Roboter-Systemen, geeignet. 


A Weiterführende Daten zu den Ergebnissen 


der Experimente 


Dieser Anhang enthält die exakten Zahlenwerte der Kenngrößen für die einzelnen Probanden 
aus den Experimenten in Kapitel 5. Weiterhin enthält Abschnitt A.1 auch die genauen sub- 
jektiven Bewertungen der Versuchspersonen sowie die vollständigen Ergebnisse der statisti- 
schen Vergleiche aller Übergabekonzepte aus dem ersten Experiment. Die Gliederung dieses 


Anhangs erfolgt nach den Experimenten. 


A.1 Daten zum Vergleich von Ubergabekonzepten 


Die mittlere absolute Abweichung vom Referenzwinkel Ks ist für alle 35 Probanden, aufgeteilt 
nach Szenario und Übergabekonzept, in Tabelle A.1 eingetragen. Die Angaben der Versuchs- 
personen hinsichtlich ihrer Einschätzung der Leistung im Folgen des Referenzwinkels sowie 
der Bewertung des Lenkgefühls enthält Tabelle A.2. Eine Übersicht über die Ergebnisse der 
t-Tests aller paarweisen Vergleiche der fünf untersuchten Ubergabekonzepte ist in Tabelle A.3 
gegeben. 
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Tabelle A.1: Mittlerer absoluter Referenzwinkelfehler Ks beim Experiments zum Vergleich der Ubergabekonzepte 
für alle Versuchspersonen (VP) in beiden Szenarien und den fünf Übergabekonzepten sowie jeweils 
Mittelwert u und Standardabweichung o über alle Probanden. Alle Angaben sind in °. 


Szenario „Halten“ Szenario „Anstieg“ 
VP AF AS GS GO GD AF AS GS GO GD 
1 22,24 7,03 9,83 6,21 9,42 6,70 2,91 2,29 1,68 1,71 
2 43,00 7,34 3,55 4,30 5,74 | 1520 2,24 2,40 3,97 1,75 
3 12,46 9,89 3,75 5,54 6,13 1,37 2,52 2,62 2,10 3,15 
4 2,82 2,93 3,67 6,42 2,24 1,70 2,59 2,47 2,34 0,94 
5 9,33 4,36 4,89 5,21 4,87 2,15 143 453 1,80 1,38 
6 32,40 6,36 417 9,30 5,94 3,62 1,75 5,07 3,58 3,46 
7 10,67 5,89 4,10 4,45 3,83 4,85 1,90 2,97 3,22 2,65 
8 14,77 6,93 3,56 5,60 5,38 5,44 211 2,42 1,52 1,78 
9 3,44 3,57 6,10 5,13 5,42 1,51 217 272 354 1,54 


10 4,76 3,82 3,74 3,02 4,00 2,73 321 232 3,05 1,39 
11 7,32 4,22 849 4,52 3,38 3,50 1,83 2,39 1,81 2,09 
12 | 43,37 6,65 9,04 7,60 5,42 2,62 2,78 2,29 4,72 0,86 
13 | 26,09 4,54 16,34 854 4,42 1,58 421 4,67 2,57 0,97 
14 3,74 2,51 4,06 2,59 2,47 2,54 2,20 2,39 2,30 1,36 
15 11,31 3,58 3,61 3,24 5,22 112 243 1,33 1,59 0,84 
16 11,80 3,65 3,58 4,90 3,22 3,16 2,70 2,37 1,87 1,69 
17 2,95 2,62 3,60 3,57 2,42 2,06 2,51 2,45 2,31 1,67 
18 11,81 12,80 4,22 5,18 3,22 3,54 5,57 1,98 2,47 1,48 
19 6,56 3,61 4,88 6,64 5,84 2,28 2,06 2,22 1,64 1,42 
20 3,50 5,28 4,60 3,71 3,79 2,84 5,12 3,80 2,58 2,53 
21 12,67 5,81 6,85 4,21 4,77 1,79 2,30 1,98 1,27 1,63 
22 5,92 3,98 5,04 4,83 3,92 2,04 1,99 2,52 0,95 0,90 
23 2,64 3,20 2,48 2,69 4,18 1,35 3,61 147 1,49 1,55 
24 3,99 6,23 3,17 3,48 2,86 1,06 2,93 1,78 1,86 0,99 
25 4,06 2,81 3,25 2,22 2,56 4,37 2,46 2,88 1,56 1,84 
26 17,88 4,36 10,95 6,12 5,18 1,96 2,00 3,11 192 2,21 
27 2,92 3,64 4,85 2,98 2,67 1,20 1,60 1,36 1,73 0,89 
28 2,44 1,81 2,24 2,15 2,49 141 297 2,12 1,69 1,02 
29 | 11,82 4,63 4,77 4,64 3,95 1,99 2,12 1,83 0,99 0,83 
30 4,25 4,10 4,76 3,08 9,38 1,64 341 2,75 1,89 2,17 
31 6,46 7,15 4,06 5,17 3,24 1,69 2,44 2,29 1,23 4,06 
32 3,30 3,44 3,17 5,36 2,91 4,89 121 187 146 1,18 
33 4,53 2,55 3,05 4,84 5,51 | 15,71 2,94 2,09 4,62 2,15 
34 | 24,29 4,31 8,02 2,91 2,31 2,50 2,22 1,14 2,76 1,18 
35 3,50 3,16 3,05 2,72 2,59 143 3,62 2,19 1,05 0,76 


H 11,27 4,80 5,13 4,66 4,31 3,30 2,63 2,49 2,20 1,66 
[02 10,93 2,24 2,87 1,73 1,77 3,32 0,93 0,88 0,97 0,78 
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Tabelle A.2: Subjektive Bewertung der Leistungen bei der Aufgabenerfüllung und des Gefühls am Lenkrad aller Ver- 
suchspersonen (VP) für alle fünf Ubergabekonzepte sowie jeweils Mittelwert und Standardabweichung 
o über alle Probanden. Die Bewertungsskala reicht von 1 (sehr schlecht bzw. unangenehm) bis 5 (sehr 


gut bzw. angenehm). 


Einschätzung der Leistung 


Bewertung des Lenkgefühls 


w 
N 


VP | AF AS GS GO GD |AF AS GS GO GD 
1 5 4 5 5 5 5 4 5 5 5 
2 3 3 2 3 3 5 1 3 2 4 
3 1 2 4 3 4 2 1 2 2 4 
4 3 4 3 4 4 4 1 4 4 3 
5 3 2 3 3 4 2 1 4 2 3 
6 4 5 4 4 3 3 4 4 4 2 
7 2 4 2 3 4 2 1 5 4 5 
8 2 2 4 2 3 5 1 5 4 5 
9 4 2 4 3 4 2 2 4 4 4 
10 | 4 4 5 4 4 4 4 5 4 4 
11 | 3 2 2 4 4 2 1 4 2 4 
12 | 4 2 4 3 4 3 2 5 3 5 
13 | 4 3 4 4 4 5 1 5 5 5 
14 | 3 2 4 4 5 2 1 3 4 4 
15 | 4 4 4 3 3 2 1 4 4 4 
16 | 4 4 4 3 3 2 1 4 3 4 
17 | 3 4 4 4 3 1 1 5 5 4 
18 | 3 4 3 4 5 2 3 4 5 5 
19 | 2 2 4 2 3 3 2 4 5 5 
20 | 4 3 3 4 4 3 3 2 3 3 
21 | 4 2 3 5 4 4 2 4 5 4 
22 | 3 3 3 3 3 5 5 5 5 5 
23 | 4 4 4 4 4 3 4 4 4 4 
24 | 2 3 4 4 4 2 4 3 4 4 
25 | 3 2 3 4 4 2 1 2 2 2 
26 | 2 2 1 4 4 1 1 3 5 4 
27 | 4 4 4 2 4 5 2 4 2 2 
28 | 3 2 4 4 4 4 2 5 4 5 
29 | 4 4 4 4 3 5 1 5 5 5 
30 | 2 2 3 3 5 1 1 5 2 5 
31 |2 3 4 4 3 2 1 3 4 4 
32 | 4 1 5 4 5 5 1 5 2 5 
33 | 4 2 5 2 4 4 1 5 5 3 
3 2 4 4 5 3 2 2 4 5 
1 1 
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1,39 122 1,06 1,12 0,94 
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Tabelle A.3: Detaillierte Ergebnisse der paarweisen t-Tests für alle Kombinationen der Übergabekonzepte in beiden 
Szenarien 


Szenario Nullhypothese Ho p-Wert Signifikanzniveau 


Halten HAF < Has 0,0003 hoch signifikant 
Halten HAF < HGS 0,0004 hoch signifikant 
Halten HAF < HGO 0,0002 hoch signifikant 
Halten HAF < HGD 0,0002 hoch signifikant 
Halten HAS < HGS 0,7119 nicht signifikant 
Halten HAS < HGO 0,3610 nicht signifikant 
Halten HAS < HGD 0,1211 nicht signifikant 
Halten HGS < HGO 0,1363 nicht signifikant 
Halten HGS < HGD 0,0551 nicht signifikant 
Halten HGO < HGD 0,1493 nicht signifikant 
Anstieg HAF < HAS 0,1320 nicht signifikant 
Anstieg HAF < HGS 0,0855 nicht signifikant 
Anstieg HAF < HGO 0,0166 signifikant 
Anstieg HAF < HGD 0,0027 sehr signifikant 
Anstieg HAS < HGS 0,2504 nicht signifikant 
Anstieg HAS < HGO 0,0276 signifikant 
Anstieg HAS < HGD <0,0001 hoch signifikant 
Anstieg HGS < HGO 0,0758 nicht signifikant 
Anstieg HGS < HGD <0,0001 hoch signifikant 
Anstieg HGO < HGD 0,0039 sehr signifikant 


A.2 Daten zum Vergleich von direkter und kooperativer 
Übergabe der Fahrzeugquerführung 


Die nachfolgenden Tabellen A.4 und A.5 zeigen die Kennzahlen K+, Kg, K^ und Ka zur Be- 
wertung der Fahrsituation für jeden gültigen Teilnehmer des Experiments zum Vergleich von 
direkter und kooperativer Transition der Fahraufgabe. Die Berechnung der Kennzahlen er- 
folgt entsprechend ihrer Definition in Abschnitt 5.2.1. Der kleinste Abstand zu einem anderen 
Objekt ist hierbei aufgeteilt in den kleinsten Abstand zur Schutzplanke ds und den kleinsten 
Abstand zum Hindernis dy. Die Größe Ky ergibt sich aus dem Minimum der beiden Werte. 


A.2 Daten zum Vergleich von direkter und kooperativer Übergabe der Fahrzeugquerführung XIX 


Tabelle A.4: Kennzahlen aller Versuchspersonen (VP) aus dem Experiment zum Vergleich von direkter und koope- 
rativer Übergabe der Fahrzeugquerführung für den Versuchsdurchgang mit direkter Transition sowie 
jeweils Mittelwert u, Standardabweichung o, Minimal- und Maximalwert über alle Probanden. Die Kenn- 
zahl K4 ergibt sich aus dem Minimum des kleinsten Abstands zur Schutzplanke ds und dem kleinsten 
Abstand zum Hindernis dy, die hier getrennt aufgetragen sind. 


VP | Krins Kjinm Kıinm Kainm/s? 
ds dy 

1 2,411 1,544 0,662 3,315 5,377 
2 1,423 1,540 2,079 1,903 4,668 
3 2,474 1,450 1,548 2,523 4,043 
4 2,162 1,156 2,259 2,106 2,613 
5 2,075 2,083 1,744 1,695 1,421 
6 0,161 -0,006 0,730 4,798 8,833 
7 2,033 1,885 1,478 2,158 4,511 
8 1,610 1,184 2,504 1,834 3,030 
9 2,851 1,929 1,907 1,685 3,158 
10 1,979 1,640 1,943 1,938 2,356 
11 1,382 2,296 1,386 1,839 2,730 
12 0,962 2,401 1,365 1,755 3,684 
13 2,131 2,044 0,058 3,420 5,801 
14 | 0,966 1,094 2,541 1,886 6,998 
15 1,265 0,323 2,106 3,093 8,939 
16 | 4,366 2,011 1,681 1,829 2,009 
17 3,051 -0,002 1,077 4,446 4,008 
18 1,764 2,074 1,742 1,706 2,183 
19 1,044 0,933 2,298 2,291 2,634 
20 1,993 1,362 2,201 1,959 3,073 
21 1,568 1,709 2,009 1,804 2,618 
22 2,020 1,895 0,845 2,781 4,173 
23 1,665 2,328 1,496 1,698 1,759 
24 1,634 0,546 2,143 2,833 6,925 
25 1,707 1,674 1,824 2,023 3,046 
26 1,501 0,891 2,800 1,831 2,627 
27 1,157 1013 1826 2,683 0,910 
28 0,902 2,121 1,568 1,832 3,332 
29 | 24355 1683 1,965 1,873 1,949 
30 1,977 1,962 1,838 1,722 1,313 
31 0,608 0,986 1,788 2,747 4,554 
u 1,783 1,191 2,323 3,718 
o 0,798 0,555 0,795 2,015 

min | 0,161 -0,006 1,685 0,910 

max | 4,366 1,906 4,798 8,939 


XX A Weiterführende Daten zu den Ergebnissen der Experimente 


Tabelle A.5: Kennzahlen aller Versuchspersonen (VP) aus dem Experiment zum Vergleich von direkter und koopera- 
tiver Übergabe der Fahrzeugquerführung für den Versuchsdurchgang mit kooperativer Transition sowie 
jeweils Mittelwert u, Standardabweichung o, Minimal- und Maximalwert über alle Probanden. Die Kenn- 
zahl K4 ergibt sich aus dem Minimum des kleinsten Abstands zur Schutzplanke ds und dem kleinsten 
Abstand zum Hindernis dy, die hier getrennt aufgetragen sind. 


VP | Krins K,inm Kıinm Kain m/s? 
ds dy 

1 1,855 2,299 1,260 1,963 2,713 
2 1,926 1,611 1,923 1,987 1,659 
3 3,402 1,629 1,978 1,914 3,071 
4 1,616 1,846 1,800 1,876 4,990 
5 3,210 1,720 1,947 1,854 2,546 
6 2,644 1,688 2,073 1,760 3,791 
7 2,598 1,136 2,603 1,782 1,902 
8 1,521 2082 1,724 1,716 2,139 
9 3,257 1,555 2,030 1,936 4,627 
10 1122 2136 1,642 1,743 2,840 
11 2,229 1,860 1,965 1,697 1,521 
12 2,630 1,928 1,918 1,676 1,604 
13 1,772 1,360 1,949 2,213 4,857 
14 2127 1,868 1,936 1,717 3,419 
15 1,452 1,89 1,981 1,851 1,538 
16 2,492 1,451 2297 1,773 6,109 
17 2,919 1,529 2113 1,879 2,289 
18 1,792 1,747 1,680 2,095 3,604 
19 1,994 1,159 2537 1,825 2,402 
20 2,013 1,360 2,329 1,833 1,570 
21 2125 1,71 1905 1,946 2,958 
22 1158 0,133 0177 5,211 8,079 
23 1,948 2,024 1,629 1,868 1,717 
24 3,327 1573 2,226 1,723 1,855 
25 2,297 2,100 1,707 1,715 3,139 
26 0,891 1,689 2,022 1,810 5,357 
27 1530 1,576 2,211 1,735 2,715 
28 2,828 1,316 2,160 2,046 2,343 
29 2,817 1,384 2,116 2,022 1,707 
30 2,167 2,139 1,699 1,684 1,234 
31 1,527 1,681 2,038 1,803 2,424 
u 2,167 1,539 1,957 2,991 
o 0,675 0,327 0,618 1,572 

min | 0,891 0,133 1,676 1,234 

max | 3,402 1,918 5,211 8,079 
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A.3 Daten zum Vergleich von kooperativen Ubergaben 
der Fahrzeugquerführung mit zeitbasiertem und 


adaptivem Transitionsverlauf 


Die Kennzahlen zur Bewertung der Fahrsituation für jeden gültigen Teilnehmer des Experi- 
ments zum Vergleich von zeitbasiertem und adaptivem Verlauf der Transition werden in den 
Tabellen A.6 und A.7 gezeigt . Die Bewertungskriterien des vorherigen Experiments (vgl. An- 
hang A.2) werden dafür um die Kennzahl K, ergänzt, welche im Abschnitt 5.3.1 definiert ist. 


XXII A Weiterführende Daten zu den Ergebnissen der Experimente 


Tabelle A.6: Kennzahlen aller Versuchspersonen (VP) aus dem Experiment zum Vergleich von kooperativen Überga- 
ben der Fahrzeugquerführung mit zeitbasiertem und adaptivem Transitionsverlauf für den Versuchs- 
durchgang mit zeitbasiertem Transitionsverlauf sowie jeweils Mittelwert u, Standardabweichung o, 
Minimal- und Maximalwert über alle Probanden. Die Kennzahl Kg ergibt sich aus dem Minimum des 
kleinsten Abstands zur Schutzplanke ds und dem kleinsten Abstand zum Hindernis dy, die hier getrennt 
aufgetragen sind. 


VP | Krins Kginm Kıinm Kain m/s” Ky inm 
ds dy 

1 2,256 1,842 1,900 1,780 1,487 0,392 
2 1,886 1,722 2,095 1,705 1,469 0,164 
3 1,639 2,032 1,750 1,740 1,768 0,231 
4 1,250 1,720 1,841 1,961 3,246 0,468 
5 0,863 1,823 1,578 2,121 2,744 0,464 
6 1,797 2,021 1,815 1,686 3,337 0,181 
7 2,504 1,215 1,816 2,491 5,851 0,708 
8 1,104 1,643 1,924 1,954 3,103 0,539 
9 0,336 1,842 0,879 2,800 4,406 0,265 
10 2,159 1,610 1,960 1,951 1,974 0,383 
11 2,138 1,673 2,137 1,712 2,456 0,042 
12 2,063 1,448 2,348 1,726 2,227 0,429 
13 0,868 1,954 1,763 1,805 3,778 0,387 
14 0,725 1,365 1,796 2,360 3,329 0,419 
15 0,970 1,483 2,130 1,909 6,735 0,686 
16 1,577 1,925 0,991 2,605 3,109 0,538 
17 1,277 1,761 1,837 1,924 5,880 0,607 
18 1,647 1,665 2,132 1,724 1,456 0,141 
19 2,006 1,837 1,708 1,976 1,903 0,365 
20 2,235 1,732 2,000 1,790 4,975 0,399 
21 1,711 1,679 1,732 2,111 2,896 0,530 
22 1,771 2,322 0,534 2,665 4,090 0,267 
23 1,770 1,422 2,276 1,823 1,229 0,412 
24 1,863 2,130 1,648 1,744 2,218 0,430 
25 2,463 1,307 2,249 1,966 1,884 0,446 
26 1,952 1,270 2,332 1,920 2,506 0,221 
27 1,845 1,823 1,976 1,722 3,070 0,546 
28 1,339 2,169 1,653 1,699 2,333 0,686 
29 0,995 0,551 2,559 2,412 7,901 0,617 
30 1,878 1,618 1,754 2,150 2,103 0,325 
31 1,839 1,578 2,116 1,828 1,001 0,671 
H 1,636 1.496 1,992 3,112 0,418 
oO 0,537 0,348 0,315 1,676 0,174 

min 0,336 0,534 1,686 1,001 0,042 

max 2,504 1,842 2,800 7,901 0,708 


A.3 Daten zum Vergleich von kooperativen Ubergaben mit zeitbasiertem und adaptivem Transitionsverlauf XXIII 


Tabelle A.7: Kennzahlen aller Versuchspersonen(VP) aus dem Experiment zum Vergleich von kooperativen Uber- 
gaben der Fahrzeugquerführung mit zeitbasiertem und adaptivem Transitionsverlauf für den Ver- 
suchsdurchgang mit adaptivem Transitionsverlauf sowie jeweils Mittelwert u, Standardabweichung o, 
Minimal- und Maximalwert über alle Probanden. Die Kennzahl Kg ergibt sich aus dem Minimum des 
kleinsten Abstands zur Schutzplanke ds und dem kleinsten Abstand zum Hindernis dy, die hier getrennt 
aufgetragen sind. 


VP | Krins Kyinm Kıinm Kginm/s* Kyinm 
ds da 

1 1,789 1,787 2,038 1,696 2,373 0,174 
2 0,312 -0,033 1,412 4,143 7,967 0,528 
3 0,963 1,598 1,756 2,168 3,330 0,087 
4 2,190 1,262 1,904 2,356 2,796 0,261 
5 1,347 1,589 1,995 1,938 3,204 0,273 
6 1,542 1,748 1,776 1,997 3,197 0,177 
7 1,386 2,447 0,528 2,547 8,030 0,523 
8 1,871 1873 1,722 1,926 2,825 0,199 
9 1,284 2,179 1,224 2,119 4,312 0,574 
10 | 1,413 1,483 1,602 2,437 2,720 0,463 
11 | 2,806 1,504 2,326 1,691 2,114 0,073 
12 1,653 2347 1,202 1,972 4,140 0,177 
13 | 2,022 1,14 2,084 1,724 1,853 0,144 
14 | 0,703 2,255 1,414 1,853 4,674 0,442 
15 | 245 1111 2,091 2,319 6,351 0,316 
16 1,749 1,498 2,180 1,844 2,772 0,229 
17 1,079 1,901 1,231 2,389 6,640 0,616 
18 1,988 1,969 1,865 1,688 2,219 0,310 
19 | 2,273 1,252 1,939 2,330 3,177 0,176 
20 | 2,142 1,299 1,196 3,026 7,399 0,298 
21 1,715 2,451 1396 1,675 3,616 0,336 
22 1,701 2,137 0,839 2,545 3,352 0,472 
23 1,577 1,938 1,631 1,952 4,618 0,212 
24 | 1,745 2,052 1,662 1,808 3,307 0,400 
25 | 2,044 1,675 2,134 1,713 3,342 0,497 
26 1,406 2,145 1,703 1,674 3,008 0,267 
27 | 2,097 1,645 2,008 1,868 4,598 0,131 
28 1,492 2,250 1,569 1,703 2,431 0,219 
29 | 1,783 2,150 1,665 1,706 1,797 0,214 
30 | 1,302 1,627 2,128 1,767 3,351 0,117 
31 | 0,273 0,508 1,124 3,890 6,819 0,191 
m 1,616 1,381 2,144 3,946 0,293 
o 0,564 0,427 0,602 1,805 0,153 

min | 0,273 -0,033 1,674 1,797 0,073 

max | 2,806 1,863 4,143 8,030 0,616 


Literaturverzeichnis 


Eigene Veröffentlichungen und Tagungsbeiträge 


[FKM*20] 


[FLH18] 


[FLR*20] 


[KGHL17] 


[KLBH14] 


[LDFH14] 


[LGFH17] 


FLAD, M.; KARG, P.; MARTIN, M.; ROITBERG, A.; MAZEWITSCH, M.; KENAR, E.; AH- 
RENS, L.; FLECKEN, B.; KALB, L.; KARAKAYA, B.; LUDWIG, J.; PRUKSCH, A.; STIEFEL- 
HAGEN, R.; HOHMANN, S.: Smart Automotive Mobility - Reliable Technology for the 
Mobile Human, Kapitel Personalisation and Control Transition between Automa- 
tion and Driver in Highly Automated Cars (Springer), 2020, Veröffentlichung aus- 
stehend 


FLAD, M.; LUDWIG, J.; HOHMANN, S.: Differential-game-based driver assistance sys- 
tem for fuel-optimal driving, in: The Twelfth International Conference Game Theory 
and Management, 12 (Saint Petersburg, Russia), 2018, S. 43 


FLAD, M.; Lupwic, J.; ROITBERG, A.; KARG, P.; STIEFELHAGEN, R; HoH- 
MANN, S.: Schlussbericht des Karlsruher Instituts fiir Technologie fiir das BMBF- 
Forschungsvorhaben Personalisierte, adaptive, kooperative Systeme für automatisier- 
te Fahrzeuge, Technischer Bericht, Karlsruher Institut für Technologie (KIT), 2020, 


Veröffentlichung ausstehend 


Konic, A.; GUTBROD, M.; HOHMANN, S.; LUDWIG, J.: Bridging the gap between open 
loop tests and statistical validation for highly automated driving, in: SAE Interna- 
tional Journal of Transportation Safety, 5, Nr. 1, 2017, S. 81-87 


Kaspar, S.; LUDWIG, J.; BÜNTE, T.; HOHMANN, S.: Robust torque vectoring control, 
in: Proceedings of the 19th IFAC World Congress, Band 47 (Cape Town, South Africa), 
2014, S. 12023-12028 


LUDWIG, J.; DIEHM, G.; FLAD, M.; HoHMANN, S.: Optimal interaction structure of 
human drivers cooperation: A pilot study, in: IEEE International Conference on Sys- 
tems, Man, and Cybernetics (SMC) (San Diego, USA), 2014, S. 3593-3598 


LUDWIG, J.; GOTE, C.; FLAD, M.; HOHMANN, S.: Cooperative dynamic vehicle control 
allocation using time-variant differential games, in: IEEE International Conference 
on Systems, Man, and Cybernetics (SMC) (Banff, Canada), 2017, S. 117-122 


XXVI 


Literaturverzeichnis 


[LHFH18] Lupwic, J.; Haas, A.; FLAD, M.; HOHMANN, S.: A comparison of concepts for control 


transitions from automation to human, in: IEEE International Conference on Systems, 
Man, and Cybernetics (SMC) (Miyazaki, Japan), 2018, S. 3201-3206 


[LMH*18] Lupwic, J.; MARTIN, M.; Horne, M.; FLAD, M.; VoIT, M.; STIEFELHAGEN, R.; HOH- 


[MLR*19] 


[MSK*15] 


MANN, S.: Driver observation and shared vehicle control supporting the driver on 
the way back into the control loop, in: at - Automatisierungstechnik, 66, Nr. 2, 2018, 
S. 146-159 


MARTIN, M.; LUDWIG, J.; ROITBERG, A.; FLAD, M.; Voir, M.; HOHMANN, S.; STIE- 
FELHAGEN, R.: Innenraumbeobachtung fiir die kooperative Ubergabe zwischen 
hochautomatisierten Fahrzeugen und Fahrer, in: 10. VDI-Tagung Mensch-Maschine- 
Mobilität, Band 10 (Braunschweig, Deutschland), 2019 


MATTHIESEN, S.; SCHMIDT, S.; KLINGLER, S.; PINNER, T.; EISENMANN, M.; LUDWIG, 
J;; Houmann, S.; ALBERS, A.: Supporting validation activities and self-reflection 
processes in interdisciplinary design teams, in: Proceedings of the 17th Internatio- 
nal Conference on Engineering and Product Design Education (E&PDE15), Band 17 
(Loughborough, UK), 2015, S. 418-423 


[MSLH15] MATTHIESEN, S.; SCHMIDT, S.; LUDWIG, J.; HoHMANN, S.: Iteratives Vorgehen 


in räumlich getrennten mechatronischen Entwicklungsteams - Das Wechselspiel 
von Synthese und testbasierter Analyse, in: Fachtagung Mechatronik (Dortmund, 
Deutschland), 2015, S. 137-142 


Literaturverzeichnis XXVII 


Betreute studentische Arbeiten 


[Ayl16] AyıLön WRIEDT, C.C.: Aufbau eines Versuchs zur Analyse der kooperativen Lenk- 
radwinkelbestimmung, Bachelorarbeit, Fakultät für Elektrotechnik und Informations- 
technik, Karlsruher Institut für Technologie (KIT), 2016 


[Geb18] GEBHARD, M.: Optimale Kooperation durch Modelladaption in Differentialspielen, Mas- 
terarbeit, Fakultät für Elektrotechnik und Informationstechnik, Karlsruher Institut für 
Technologie (KIT), 2018 


[Got16] GoTE, C.: Development and comparison of adaption functions for advanced driver assi- 
stant systems in takeover scenarios by means of differential games, Masterarbeit, Fakul- 
tät für Elektrotechnik und Informationstechnik, Karlsruher Institut für Technologie 
(KIT), 2016 


[Haa18] Haas, A.: Parametrierung und Vergleich von Konzepten zur Handlungsübergabe zwi- 
schen Mensch und Maschine, Bachelorarbeit, Fakultät für Elektrotechnik und Informa- 
tionstechnik, Karlsruher Institut für Technologie (KIT), 2018 


[Har17] Harr, V.: Ermittlung des Fahrerfokus unter Verwendung eines Eye-Tracking-Systems, 
Bachelorarbeit, Fakultät für Elektrotechnik und Informationstechnik, Karlsruher In- 
stitut für Technologie (KIT), 2017 


[Kel16] Kert, M.S.: Entwurf und Implementierung eines Lenkmodells für einen Fahrsimula- 
tor, Bachelorarbeit, Fakultät für Elektrotechnik und Informationstechnik, Karlsruher 
Institut für Technologie (KIT), 2016 


[Liul8] Liv, H.: Online estimation of human readiness to takeover, Masterarbeit, Fakultät für 
Elektrotechnik und Informationstechnik, Karlsruher Institut für Technologie (KIT), 
2018 


[Ott18] OTT, F.: Implementierung eines kooperativen Querfiihrungsassistenzsystems für Uber- 
gaben zwischen Fahrer und Fahrzeug, Bachelorarbeit, Fakultät für Elektrotechnik und 
Informationstechnik, Karlsruher Institut für Technologie (KIT), 2018 


[Sch17] SCHNEIDER, J.: Implementierung einer manöver- und streckenbasierten Sollwertgenerie- 
rung für Fahrerasssistenzsysteme, Bachelorarbeit, Fakultät für Elektrotechnik und In- 
formationstechnik, Karlsruher Institut für Technologie (KIT), 2017 


[Wör17] WÖRNER, M.: Implementierung und Vergleich von Algorithmen für die kooperative Re- 
gelung, Bachelorarbeit, Fakultät für Elektrotechnik und Informationstechnik, Karls- 
ruher Institut für Technologie (KIT), 2017 


XXVII 


Literaturverzeichnis 


Offentlich zugängliche Quellen 


[AM10] 


[AMB12] 


[ARB* 15] 


[BAHH11] 


[Bau16] 


[BBM17] 


[BD06] 


[BO99] 


[Bre11] 


[BS14] 


[BSMM08] 


[BW16] 


ABBINK, D.A.; MULDER, M.: Neuromuscular analysis as a guideline in designing 
shared control, in: Advances in Haptics (IntechOpen), 2010 


ABBINK, D.A.; MULDER, M.; BOER, E.R.: Haptic shared control: Smoothly shifting 
control authority?, in: Cognition, Technology & Work, 14, Nr. 1, 2012, S. 19-28 


AEBERHARD, M.; RAUCH, S.; BAHRAM, M.; TANZMEISTER, G.; THOMAS, J.; PILAT, Y.; 
Homm, F.; HuBER, W.; KAEMPCHEN, N.: Experience, results and lessons learned 
from automated driving on Germany’s highways, in: IEEE Intelligent Transporta- 
tion Systems Magazine, 7, Nr. 1, 2015, S. 42-57 


BOESSENKOOL, H.; ABBINK, D.A.; HEEMSKERK, C.J.M.; VAN DER HELM, F.C.T.: Hap- 
tic shared control improves tele-operated task performance towards performance 
in direct control, in: 2011 IEEE World Haptics Conference, 2011, S. 433-438 


Bauso, D.: Game theory with engineering applications (SIAM, Society for Industrial 
and Applied Mathematics), 2016 


BORRELLI, F.; BEMPORAD, A.; MORARI, M.: Predictive control for linear and hybrid 
systems (Cambridge University Press, Cambridge), 2017 


Bortz, J.; Döring, N.: Forschungsmethoden und Evaluation: Für Human- und So- 
zialwissenschaftler, Springer-Lehrbuch (Springer-Verlag, Heidelberg), 4. Auflage, 
2006 


Basar, T.; OLSDER, G.: Dynamic noncooperative game theory, Classics in applied 
mathematics; 23 (SIAM, Society for Industrial and Applied Mathematics, Philadel- 
phia, Pa.), 2. Auflage, 1999 


BRESSAN, A.: Noncooperative differential games, in: Milan Journal of Mathematics, 
79, Nr. 2, 2011, S. 357-427 


BRANDENBURG, S.; SKOTTKE, E.: Switching from manual to automated driving and 
reverse: Are drivers behaving more risky after highly automated driving?, in: 17th 
International IEEE Conference on Intelligent Transportation Systems (ITSC), 2014, S. 
2978-2983 


BRONSTEIN, I.N.; SEMENDJAEV, K.A.; MusIoL, G.; MÜHLIG, H. (Hg.): Taschenbuch 
der Mathematik (Verlag Harri Deutsch, Frankfurt am Main), 7. Auflage, 2008 


BARTHOLOMAE, F.; WIENS, M.: Spieltheorie: Ein anwendungsorientiertes Lehrbuch, 
SpringerLink (Springer, Wiesbaden), 2016 


Literaturverzeichnis XXX 


[CRBM07] 


[CWV*11] 


[DFTB12] 


[EB10] 


[EG17] 


[EK95a] 


[Endss] 


[Eng05] 


[ES97] 


[FHH* 12] 


[Fis16] 


[FKL*08] 


CAMPBELL, J.; RICHARD, C.; BROWN, J.; MCCALLUM, M.: Crash warning system in- 
terfaces: Human factors insights and lessons learned, Technischer Bericht, National 
Highway Traffic Safety Administration, 2007 


CORREIA GRAcIO, B.J., WENTINK, M.; VALENTE Pats, A.R.; VAN PAASSEN, M.M.; 
MULDER, M.: Driver behavior comparison between static and dynamic simulation 
for advanced driving maneuvers, in: Presence: Teleoperators and Virtual Environ- 
ments, 20, Nr. 2, 2011, S. 143-161 


DAMBöCcK, D.; FARID, M.; TONERT, L.; BENGLER, K.: Ubernahmezeiten beim hoch- 


automatisierten Fahren, in: Tagung Fahrerassistenz München, 15, 2012, S. 16 


Enes, A.; Book, W.: Blended shared control of Zermelo’s navigation problem, in: 
American Control Conference (ACC), 2010, S. 4307 - 4312 


Ersoy, M.; Gres, S. (Hg.): Fahrwerkhandbuch: Grundlagen - Fahrdynamik — Fahr- 
verhalten — Komponenten — Elektronische Systeme — Fahrerassistenz — Autono- 


mes Fahren — Perspektiven (Springer-Verlag), 2017 


EnDsLEy, M.; Kırıs, E.: The out-of-the-loop performance problem and level of 
control in automation, in: Human Factors, 37, Nr. 2, 1995, S. 381-394 


ENDSLEY, M.: Situation awareness global assessment technique (SAGAT), in: Pro- 
ceedings of the IEEE 1988 National Aerospace and Electronics Conference (Dayton, 
USA), 1988, S. 789-795 


ENGWERDA, J.C.: LQ dynamic optimization and differential games (John Wiley & 
Sons), 2005 


ENDSLEY, M.; STRAUCH, B.: Automation and situation awareness: The accident at 
Cali, Columbia, in: Proceedings of the Ninth International Symposium on Aviation 
Psychology, 1997, S. 877-881 


FLEMISCH, F.; HEESEN, M.; HEsse, T.; KELSCH, J.; SCHIEBEN, A.; BELLER, J.: Towards 
a dynamic balance between humans and automation: Authority, ability, respon- 
sibility and control in shared and cooperative control situations, in: Cognition, 
Technology & Work, 14, Nr. 1, 2012, S. 3-18 


FISCHER, F.: Einfluss von fahrfremden Tätigkeiten auf die Fahrerverfügbarkeit beim 
hochautomatisierten Fahren, Masterarbeit, Technische Universität München, 2016 


FLEMISCH, F.; KELSCH, J.; LOPER, C.; SCHIEBEN, A.; SCHINDLER, J.; HEESEN, M.: Co- 
operative control and active interfaces for vehicle assistance and automation, in: 
FISITA World Automotive Congress, 2008 


Literaturverzeichnis 


[Fla16] 


[F5194] 


[FOSH14] 


[GDLB13] 


[Gen17] 


[GG05] 


[GWS08] 


[Hay72] 


[H106] 


[HSB12] 


[IFH19] 


[Isa54a] 


[Isa54b] 


FLAD, M.: Kooperative Regelungskonzepte auf Basis der Spieltheorie und deren An- 
wendung fiir die Fahrerassistenz, Dissertation, Karlsruher Institut fiir Technologie, 
2016 


FÖLLINGER, O.: Optimale Steuerung und Regelung, Methoden der Regelungs- und 
Automatisierungstechnik (Oldenbourg, München), 3. Auflage, 1994 


FLAD, M.; OTTEN, J.; SCHWAB, S.; HOHMANN, S.: Steering driver assistance system: 
A systematic cooperative shared control design approach, in: IEEE International 
Conference on Systems, Man and Cybernetics (SMC), 2014, S. 3585-3592 


Gorp, C.; DAMBÖCK, D.; LORENZ, L.; BENGLER, K.: “Take over!” How long does it 
take to get the driver back into the loop?, in: Proceedings of the Human Factors and 
Ergonomics Society Annual Meeting, Band 57, 2013, S. 1938-1942 


GENTLE, J.E.: Matrix algebra: theory, computations and applications in statistics 


(Springer Verlag, Hrsg.: DeVeaux, R.; Fienberg, S.; Ingram, O.), 2. Auflage, 2017 


GRIFFITHS, P.G.; GILLESPIE, R.B.: Sharing control between humans and automati- 
on using haptic interface: primary and secondary task performance benefits, in: 
Human factors, 47, Nr. 3, 2005, S. 574-590 


GOODRICH, K.; WILLIAMS, R.; ScHUTTE, P.: Piloted evaluation of the h-mode, a 
variable autonomy control system, in motion-based simulation, in: AIAA Atmos- 
pheric Flight Mechanics Conference and Exhibit, 2008, S. 6554-6569 


HAYWARD, J.C.: Near miss determination through use of a scale of danger, in: 
Highway Research Record, , Nr. 384, 1972, S. 24-34 


Ho iter, M.; ILLING, G.: Einführung in die Spieltheorie (Springer), 6. Auflage, 2006 


Hatz, K.; SCHLODER, J.P.; Bock, H.G.: Estimating parameters in optimal control 
problems, in: SIAM Journal on Scientific Computing, 34, Nr. 3, 2012, S. A1707- 
A1728 


INGA, J.; FLAD, M.; HOHMANN, S.: Validation of a human hooperative steering be- 
havior model based on differential games, in: IEEE International Conference on 
Systems, Man and Cybernetics (SMC), 2019 


Isaacs, R.: Differential games I: Introduction, Technischer Bericht, RAND Corpo- 
ration, Santa Monica, USA, 1954 


Isaacs, R.: Differential games II: The definition and formulation, Technischer Be- 
richt, RAND Corporation, Santa Monica, USA, 1954 


Literaturverzeichnis XXXI 


[Isa54c] 


[Isa55] 


[S012] 


[JAB13] 


[Kir04] 


[KKB18] 


[KN05] 


[Kol98] 


[KSB13a] 


[Kus19] 


[KVV16] 


[KWM16] 


Isaacs, R.: Differential games III: The basic principles of the solution process, Tech- 
nischer Bericht, RAND Corporation, Santa Monica, USA, 1954 


Isaacs, R.: Differential games VI: Mainly examples, Technischer Bericht, RAND 
Corporation, Santa Monica, USA, 1955 


Road vehicles — Ergonomic aspects of transport information and control systems — 
Calibration tasks for methods which assess driver demand due to the use of in-vehicle 
systems, Technische Spezifikation ISO/TS 14198:2012(E), International Organiza- 
tion for Standardization, Geneva, CH, 2012 


Jounson, M.; AGHASADEGHI, N.; BRETL, T.: Inverse optimal control for determini- 
stic continuous-time nonlinear systems, in: 52nd IEEE Conference on Decision and 
Control (IEEE), 2013, S. 2906-2913 


Kirk, D.E.: Optimal control theory: An introduction (Courier Corporation), 2004 


KARAKAYA, B.; KALB, L.; BENGLER, K.: Cooperative approach to overcome auto- 
mation effects during the transition phase of conditional automated vehicles, in: 
12. Workshop Fahrerassistenzsysteme und automatisiertes Fahren (FAS), 12, 2018 


KIENCKE, U.; NIELSEN, L.: Automotive control systems: For engine, driveline, and 
vehicle (Springer), 2. Auflage, 2005 


Ko tock, P.: Social dilemmas: The anatomy of cooperation, in: Annual Review of 
Sociology, 24, Nr. 1, 1998, S. 183-214 


KUCUKYILMAZ, A.; SEZGIN, T.M.; BAspoGAN, C.: Intention recognition for dynamic 
role exchange in haptic collaboration, in: IEEE Transactions on Haptics, 6, Nr. 1, 
2013, S. 58-68 


Kuscu, F.: Evaluierung von Interaktionskonzepten fiir hochautomatisierte Fahrzeu- 
ge in einer Fahrsimulatorstudie, Masterarbeit, Technische Universität München, 
2019 


Künn, M.; VoGELPOHL, T.; VOLLRATH, M.: Was heißt sichere Übergabe? Bewertung 
der Ubergabe von hochautomatisiertem Fahren zu manueller Steuerung mittels 
Simulatorstudie, in: VDI/VW-Gemeinschaftstagung Fahrerassistenz und automati- 
siertes Fahren, VDI-Bericht Nr. 2288, 2016 


KAUSTUBH, M.; WILLEMSEN, D.; Mazo, M.: The modeling of transfer of steering 
between automated vehicle and human driver using hybrid control framework, 
in: Intelligent Vehicles Symposium (IV) (IEEE), 2016, S. 808-814 


XXXII 


Literaturverzeichnis 


[LCZ* 18] 


[LHC* 16] 


[LK12] 


[LTC*15] 


[Lud11] 


[Lun14] 


[LW15] 


[LWC*18] 


[MCP 16] 


[Meh07] 


[MJL*14] 


[MS19] 


Lv, C.; Cao, D.; ZHAO, Y.; AUGER, D.; SULLMAN, M.; WANG, H.; DUTKA, L.; SKRYP- 
CHUK, L.; MOUZAKITIS, A.: Analysis of autopilot disengagements occurring during 
autonomous vehicle testing, in: IEEE/CAA Journal of Automatica Sinica, 5, Nr. 1, 
2018, S. 58-68 


Lu, Z.; HAPPEE, R.; CABRALL, C.; KYRIAKIDIS, M.; DE WINTER, J.: Human factors 
of transitions in automated driving: A general framework and literature survey, 
in: Transportation Research Part F: Traffic Psychology and Behaviour, 43, 2016, S. 
183-198 


LEVINE, S.; KOLTUN, V.: Continuous inverse optimal control with locally optimal 
examples, in: Proceedings of the 29th International Conference on Machine Learning 
(ICML-12), 29, 2012, S. 41-48 


Li, Y.; TEE, K.P.; CHAN, W.L.; YAN, R.; CHUA, Y.; Limpu, D.K.: Continuous role 
adaptation for human-robot shared control, in: IEEE Transactions on Robotics, 31, 
Nr. 3, 2015, S. 672-681 


LUDWIG, J.: Aufbau eines Versuchs zur Untersuchung kooperativer Fahrzeugquer- 


führung, Bachelorarbeit, Karlsruher Institut für Technologie, 2011 


LuNZE, J.: Regelungstechnik 2 : Mehrgrößensysteme, Digitale Regelung, Springer- 
Lehrbuch (Springer Vieweg, Berlin, Heidelberg), 8. Auflage, 2014 


Lu, Z.; DE WINTER, J.: A review and framework of control authority transitions 
in automated driving, in: Procedia Manufacturing, 3, 2015, S. 2510-2517 


Lv, C.; WANG, H.; Cao, D.; ZHAO, Y.; SULLMAN, M.; AUGER, D.J.; BRIGHTON, J.; 
MATTHIAS, R.; SKRYPCHUK, L.; MOUZAKITIS, A.: A novel control framework of 
haptic take-over system for automated vehicles, in: IEEE Intelligent Vehicles Sym- 
posium (IV) (IEEE), 2018, S. 1596-1601 


Maske, H.; CHOWDHARY, G.; PAGILLA, P.: Intent aware shared control in off- 
nominal situations, in: IEEE International Conference on Decision and Control 
(CDC), 2016, S. 5171 - 5176 


MEHLMANN, A.: Strategische Spiele für Einsteiger (Friedrich Vieweg & Sohn), 2007 


MERAT, N.; Jamson, A.H.; Lat, F.C.; DALy, M.; CARSTEN, O.M.: Transition to ma- 
nual: Driver behaviour when resuming control from a highly automated vehicle, 
in: Transportation Research Part F: Traffic Psychology and Behaviour, 27, 2014, S. 
274-282 


MESSER, M.; SCHNEIDER, G.: Statistik: Theorie und Praxis im Dialog (Springer- 
Verlag), 2019 


Literaturverzeichnis XXXII 


[MTL10] 


[MW13] 


[Nas51] 


[NC13] 


[Neu28] 


[NMN14a] 


[NW06] 


[OKSB10] 


[PCC*15] 


[PGPB11] 


[PHM*15] 


[PHMM13] 


MOMBAUR, K.; TRUONG, A.; LAUMOND, J.: From human to humanoid locomoti- 
on—an inverse optimal control approach, in: Autonomous Robots, 28, Nr. 3, 2010, 
S. 369-383 


MITSCHKE, M.; WALLENTOWIZ, H.: Dynamik der Kraftfahrzeuge (Springer-Verlag), 
2013 


Nasu, J.: Non-cooperative games, in: Annals of Mathematics, 1951, S. 286-295 


NA, X.; CoLE, D.J.: Linear quadratic game and non-cooperative predictive methods 
for potential application to modelling driver-AFS interactive steering control, in: 
Vehicle System Dynamics, 51, Nr. 2, 2013, S. 165-198 


von NEUMANN, J.: Zur Theorie der Gesellschaftsspiele, in: Mathematische Anna- 
len, 100, Nr. 1, 1928, S. 295-320 


NAUJoKs, F.; MAI, C.; NEUKUM, A.: The effect of urgency of take-over requests 
during highly automated driving under distraction conditions, in: Advances in 
Human Aspects of Transportation, , Nr. Part I, 2014, S. 431 


NOCEDAL, J.; WRIGHT, S.: Numerical optimization (Springer Science & Business 
Media), 2. Auflage, 2006 


Ocuz, S.O.; KUCUKYILMAZ, A.; SEZGIN, T.M.; BAsDoGAn, C.: Haptic negotiation 
and role exchange for collaboration in virtual environments, in: Haptics Sympo- 
sium, 2010, S. 371-378 


Prızss, M.C.; Conway, R.; CHo1, J.; Popovica, J.M.; RADCLIFFE, C.: Solutions to 
the inverse LOR problem with application to biological systems analysis, in: IEEE 
Transactions on Control Systems Technology, 23, Nr. 2, 2015, S. 770-777 


PASSENBERG, C.; GROTEN, R.; PEER, A.; Buss, M.: Towards real-time haptic assi- 
stance adaptation optimizing task performance and human effort, in: IEEE World 
Haptics Conference (IEEE), 2011, S. 155-160 


PETERMANN-STOCK, I.; HACKENBERG, L.; MUHR, T.; JOSTEN, J.; ECKSTEIN, L.: "Bit- 
te übernehmen Sie das Fahren!”: Ein multimodaler Vergleich von Ubernahme- 
strategien, in: 16. Braunschweiger Symposium fiir Automatisierungssysteme, Assis- 
tenzsysteme und eingebettete Systeme fiir Transportmittel (AAET), Band 16 (Braun- 
schweig, Deutschland), 2015 


PETERMANN-STOCK, I.; HACKENBERG, L.; MUHR, T.; MERGL, C.: Wie lange braucht 
der Fahrer - Eine Analyse zu Ubernahmezeiten aus verschiedenen Nebentätig- 
keiten während einer hochautomatisierten Staufahrt, in: 6. Tagung Fahrerassis- 


tenzsysteme. Der Weg zum automatischen Fahren, Band 6, 2013 


XXXIV 


Literaturverzeichnis 


[PLB15] 


[RGL*14] 


[RHN* 16] 


[RS40] 


[SAE16] 


[SCJos] 


[SEN10] 


[SH69a] 


[SH69b] 


[Stäos] 


[sws17] 


[SWS18] 


[Tad12] 


PAPAGEORGIOU, M.; LEIBOLD, M.; Buss, M.: Optimierung: Statische, dynamische, 
stochastische Verfahren fiir die Anwendung, SpringerLink (Springer Vieweg, Berlin, 
Heidelberg), 4. Auflage, 2015 


RADLMAYR, J.; GOLD, C.; LORENZ, L.; Farip, M.; BENGLER, K.: How traffic situations 
and non-driving related tasks affect the take-over quality in highly automated dri- 
ving, in: Proceedings of the Human Factors and Ergonomics Society Annual Meeting, 
Band 58 (Sage Publications Sage CA, Los Angeles, USA), 2014, S. 2063-2067 


RussELL, H.E.; HARBOTT, L.K.; Nisky, I.; PAN, S.; OKAMURA, A.M.; GERDES, J.C.: 
Motor learning affects car-to-driver handover in automated vehicles, in: Science 
Robotics, 1, Nr. 1, 2016 


RIEKERT, P.; ScHUNCK, T.E.: Zur Fahrmechanik des gummibereiften Kraftfahr- 
zeugs, in: Ingenieur-Archiv, 11, Nr. 3, 1940, S. 210-224 


SAE INTERNATIONAL: Taxonomy and definitions for terms related to driving au- 


tomation systems for on-road motor vehicles, in: SAE International, (J3016), 2016 


SHEN, D.; CRUZ JR, J.B.: Adaptive state feedback Nash strategies for linear quadra- 
tic discrete-time games, in: IFAC Proceedings Volumes, 41, Nr. 2, 2008, S. 15433- 
15438 


SENSODRIVE GMBH: Betriebsanleitung Version 4.0 SENSO-Wheel, 2010 


STARR, A.; Ho, Y.: Further properties of nonzero-sum differential games, in: Jour- 
nal of Optimization Theory and Applications, 3, Nr. 4, 1969, S. 207-219 


STARR, A.; Ho, Y.: Nonzero-sum differential games, in: Journal of Optimization 
Theory and Applications, 3, Nr. 3, 1969, S. 184-206 


STAHLIN, U.: Eingriffsentscheidung für ein Fahrerssistenzsystem zur Unfallvermei- 
dung, Dissertation, Institut fiir Automatisierungstechnik, TU Darmstadt, 2008 


SAITO, T.; WADA, T.; SonopA, K.: Control transferring between automated and 
manual driving using shared control, in: Proceedings of the 9th International Confe- 
rence on Automotive User Interfaces and Interactive Vehicular Applications Adjunct 
(ACM), 2017, S. 115-119 


Saito, T.; Wapa, T.; SonoDA, K.: Control authority transfer method for 
automated-to-manual driving via shared authority mode, in: IEEE Transactions 
on Intelligent Vehicles, 3, Nr. 2, 2018, S. 198-207 


Tappay, S.: Fahrdynamik Optimierung eines Elektrofahrzeugs mit Hilfe von Torque 
Vectoring, Diplomarbeit, Hochschule für angewandte Wissenschaften München, 
2012 


Literaturverzeichnis XXXV 


[TAT11] 


[TJo2] 


[Tra12] 


[VVK*16] 


[Way 18] 


[WHLS15] 


[Win15] 


[WK17] 


[WRW*19] 


[WSOS16] 


[YSH07] 


[Zei91] 


TAMADDONI, S.H.; AHMADIAN, M.; TAHERI, S.: Optimal vehicle stability control 
design based on preview game theory concept, in: American Control Conference 
(ACC), 2011, S. 5249-5254 


Toporov, E.; JORDAN, M.I.: Optimal feedback control as a theory of motor coor- 
dination, in: Nature Neuroscience, 5, Nr. 11, 2002, S. 1226-1235 


TRAUTMANN, C.: Entwurf eines optimalen Reglers für die Querführung eines Fahr- 
zeuges auf Basis von realen Lenkbewegungen, Diplomarbeit, Karlsruher Institut für 
Technologie, 2012 


VOGELPOHL, T.; VOLLRATH, M.; KüHn, M.; HUMMEL, T.; GEHLERT, T.: Übergabe von 
hochautomatisiertem Fahren zu manueller Steuerung Teil 1, in: GDV: Forschungs- 
bericht, Nr. 39, 2016 


Waymo: Waymo safety report - On the road to fully self-driving, Technischer Be- 
richt, Waymo, 2018 


Winner, H.; HAKUL, S.; Lotz, F.; SINGER, C.: Handbuch Fahrerassistenzsyste- 
me: Grundlagen, Komponenten und Systeme für aktive Sicherheit und Komfort 
(Springer-Vieweg, Wiesbaden), 3. Auflage, 2015 


WINTER, S.: Grundzüge der Spieltheorie (Springer), 2015 


Wana, T.; KONDO, R.: Shared authority mode: Connecting automated and manual 
driving for smooth authority transfer, in: Proceedings of FAST-zero, 2017 


Woop, M.; ROBBEL, P.; WITTMAN, D.; Liu, S.; WANG, Y.; KNOBEL, C.; BOYMANNS, D.; 
SYGUDA, S.; WILTSCHKO, T.; GARBACIK, N.; O’BRIEN, M.; DANNEBAUM, U.; WEAST, 
J.; DORNIEDEN, B.; ET AL.: Safety first for automated driving, White paper, Aptiv, 
Audi, Baidu, Continental, Daimler, Fiat Chrysler, HERE, Infineon, Intel und VW, 
2019 


WADA, T.; SONODA, K.; OKASAKA, T.; SAITO, T.: Authority transfer method from 
automated to manual driving via haptic shared control, in: IEEE International Con- 
ference on Systems, Man, and Cybernetics (SMC) (IEEE), 2016, S. 2659-2664 


Young, M.S.; STANTON, N.A.; HARRIS, D.: Driving automation: Learning from 
aviation about design philosophies, in: International Journal of Vehicle Design 
(IJVD), 45, Nr. 3, 2007, S. 323 - 338 


ZEIDLER, E.: Applied functional analysis: Main principles and their application 
(Springer Verlag, Hrsg.: Marsden, J. and Sirovich, L.), 1991 


Karlsruher Beitrage zur Regelungs- und Steuerungstechnik 
Institut für Regelungs- und Steuerungssysteme 
Karlsruher Institut für Technologie (ISSN 2511-6312) 


Band 01 Diehm, Gunter 
Identifikation des menschlichen Bewegungsverhaltens 
auf der Basis von Primitiven. 
ISBN 978-3-7315-0608-9 


Band 02 Flad, Michael 
Kooperative Regelungskonzepte auf Basis der Spieltheorie 
und deren Anwendung auf Fahrerassistenzsysteme. 
ISBN 978-3-7315-0610-2 


Band 03 Eckert, Marius 
Modellbasierte Identifikation fraktionaler Systeme 
und ihre Anwendung auf die Lithium-lonen-Zelle. 
ISBN 978-3-7315-0690-4 


Band 04 Krebs, Stefan 
Intervallbeobachter für lineare parametervariante Systeme 
und deren Anwendung auf die Asynchronmaschine. 
ISBN 978-3-7315-0857-1 


Band 05 Kaspar, Stephan 
Fahrdynamikuntersuchungen eines Elektrofahrzeugs 
mit Einzelrad-Hinterradantrieb. 
ISBN 978-3-7315-0916-5 


Band 06 Sauter, Patrick S. 
Modellierung und zentrale prädiktive Regelung 
von multimodalen Energieverteilnetzen. 
ISBN 978-3-7315-0963-9 


Band 07 Kupper, Martin 
Verteilte Zustandsschätzung fraktionaler Systeme und 
ihre Anwendung auf Lithium-lonen-Batteriesysteme. 
ISBN 978-3-7315-0971-4 


Die Bände sind unter www.ksp.kit.edu als PDF frei verfügbar oder als Druckausgabe bestellbar. 


Band 08 Merkert, Lennart 
Optimal Scheduling of Combined Heat and Power Generation 
Considering Heating Grid Dynamics. 
ISBN 978-3-7315-1056-7 


Band 09 Ludwig, Julian 
Automatisierte kooperative Transition einer Regelungsaufgabe 
zwischen Mensch und Maschine am Beispiel des hochautomati- 
sierten Fahrens. 
ISBN 978-3-7315-1069-7 


Die Bände sind unter www.ksp.kit.edu als PDF frei verfügbar oder als Druckausgabe bestellbar. 


| S INSTITUT FUR REGELUNGS- UND 0 9 
STEUERUNGSSYSTEME 


Immer mehr Aufgaben können automatisiert und dadurch dem Menschen abgenommen werden. 
Herausfordernd sind dabei Situationen, in denen Menschen die Aufgabe unerwartet wieder 
übernehmen müssen, da ihre Leistungsfähigkeit durch mangelndes Situationsbewusstsein 


eingeschränkt sein kann. Ein aktuell relevantes Feld sind Übergaben im Kontext des hochau- 


tomatisierten Fahrens, da hier sicher gestellt werden muss, dass diese ohne eine Gefährdung 
des Fahrers und/oder anderer Verkehrsteilnehmer erfolgen. 

Um die Qualität bzw. Sicherheit während des gesamten Übergabeprozesses zu gewährleis- 
ten, wird in dieser Arbeit ein auf Haptic-Shared-Control basierendes Konzept vorgeschlagen, 
welches den Menschen durch haptische Interaktion am Stellglied unterstützt. Die hier ver- 
wendete Beschreibung der Mensch-Maschine-Interaktion mit Hilfe von zeitvarianten Diffe- 
rentialspielen erlaubt die Ableitung von Anforderungen für eine optimale Unterstützung und 
darauf aufbauend einen modellbasierten Reglerentwurf. Weiterhin wurde in dieser Arbeit eine 
Methodik entwickelt, um die aktuelle Bereitschaft des Menschen zur Laufzeit zu schätzen und 
den Transitionsprozess entsprechend anzupassen. 

Der Vergleich mit Methoden aus dem Stand der Technik belegt, dass die in dieser Arbeit 
entwickelten, neuartigen Verfahren eine entsprechende Auslegung der Unterstützung durch 
die Automation ermöglichen, welche zu performanteren und sichereren Transitionen von 
Aufgaben zwischen Mensch und Maschine führen. Für die hier im Fokus stehende Anwendung 
der Übernahme der Fahraufgabe nach einer hochautomatisierten Fahrt äußert sich dies in 
kontrollierteren Fahrmanövern und höheren Sicherheitsabständen. 


ISBN 978-3-7315-1069-7 


ISSN 2511-6312 | | | 
9.783731 510697" > 


ISBN 978-3-7315-1069-7 


Gedruckt auf FSC-zertifiziertem Papier 


